Trí tuệ nhân tạo [ Đăng ngày (23/08/2017) ]
Công nghệ nhận dạng giọng nói của Microsoft đánh bại một nhóm chuyên gia về khả năng phiên dịch
Đây là một cột mốc quan trọng và mang lại cho Microsoft một nền tảng âm thanh vững chắc để đi từ phiên dịch tới việc hiểu ý nghĩa của những gì đang được nói.

Tháng 10/2016 đánh dấu một cột mốc quan trọng với trí tuệ nhân tạo khi Microsoft tuyên bố rằng hệ thống của họ có thể dịch một cuộc điện thoại ngang bằng hoặc thậm chí tốt hơn con người.

Tuy nhiên, dù hệ thống của Microsoft mắc ít lỗi dịch thuật hơn so với một phiên dịch viên thông thường, nó vẫn không thể vượt qua một nhóm chuyên gia phiên dịch được đào tạo bài bản. Do đó, nhóm nghiên cứu đã tiếp tục phát triển hệ thống với sứ mệnh: Giảm tỷ lệ lỗi xuống thấp hơn mức mà một nhóm chuyên gia có thể mắc.

Hiện tại, Microsoft đã làm được điều này. Trong một tuyên bố trên blog, Xuedong Huang, trưởng nhóm nghiên cứu giọng nói của Microsoft Research, đã thông báo rằng hãng này đã vượt qua rào cản kể trên.

Đó là một cột mốc quan trọng, Huang viết. Và nó tạo ra một nền tảng âm thanh vững chắc cho công ty để từ phiên dịch tiến tới hiểu ý nghĩa của những gì đang được nói. Nhận dạng giọng nói là một thành phần cơ bản trong quá trình xây dựng một AI mạnh mẽ hơn.

"Phát triển từ việc nhận thức được tới việc hiểu giọng nói là rào cản lớn tiếp theo mà công nghệ giọng nói cần vượt qua", Huang viết.

Hệ thống nhận dạng giọng nói của Microsoft đã được cải tiến một cách nhanh chóng. Tính chính xác của khả năng phiên dịch được đánh giá trên tỷ lệ lỗi.

Theo Switchboard, tỷ lệ lỗi của Microsoft vào tháng 9/2016 là 6,3%, đồng nghĩa với việc cứ 100 từ hệ thống xác định sai hơn 6 từ. Một phiên dịch viên trung bình có tỷ lệ lỗi 5,9% và một nhóm chuyên gia được đào tạo cẩn thận sai khoảng 5,1% số từ.

Tới tháng 10, Microsoft đã giảm tỷ lệ lỗi xuống bằng phiên dịch viên trung bình và nay họ đã vượt qua nhóm thứ hai.

Đây là thành công vượt dự kiến của công ty. Năm 2015, Huang chia sẻ với Business Insider về việc xây dựng một hệ thống có thể vượt qua khả năng phiên dịch của con người trong bốn hoặc năm năm tới. Và chưa đầy hai năm sau, Microsoft đã thực hiện được kế hoạch của mình.

Dẫu vậy vẫn còn những thách thức cần vượt qua. Hệ thống phiên dịch của Microsoft đạt được kết quả này một phần nhờ dịch giọng nói được phát ra từ một điện thoại cố định với chất lượng ổn định. Tiếp theo, hệ thống cần phiên dịch chính xác khi nghe giọng nói phát ra từ kết nối không ổn định hoặc một chiếc máy bán hàng của McDonalds.

Công nghệ giọng nói "vẫn còn nhiều thách thức cần giải quyết, chẳng hạn như đạt được khả năng nhận ra giọng nói trong môi trường ồn ào với micro ở khoảng cách xa, nhận ra những điều được nhấn mạnh trong giọng nói hoặc phong cách và ngôn ngữ dù chỉ được huấn luyện bởi lượng dữ liệu hạn chế", Huang viết.

genk.vn (ntdien)
In bài viết  
Bookmark
Ý kiến của bạn

Xem nhiều

Tiêu điểm

Chuyển đổi số tại Cần Thơ: Thực trạng và giải pháp hoàn thiện hệ thống chính sách nâng cao năng lực đổi mới sáng tạo của các doanh nghiệp
Nỗ lực hoàn thiện hạ tầng công nghệ thông tin, đảm bảo kết nối thông suốt
Tập trung cao độ cho phát triển kinh tế - xã hội thành phố
Nâng cao chất lượng đội ngũ cán bộ làm công tác đối ngoại
Lãnh đạo UBND thành phố Cần Thơ làm việc với Sở Khoa học và Công nghệ về tình hình hoạt động sau khi hợp nhất ba địa phương
Hội đồng tư vấn, giao trực tiếp tổ chức chủ trì nhiệm vụ KH&CN (Tư vấn và chứng nhận Tiêu chuẩn ISO 9001:2015 – Hệ thống quản lý chất lượng - Các yêu cầu và Tiêu chuẩn ISO 14001:2015 – Hệ thống quản lý môi trường) thuộc Chương trình NSCL năm 2025
Microsoft cáo buộc nhóm tin tặc đứng sau mạng lưới Deepfake AI
Công nghệ lưu trữ lượng tử vừa đạt đột phá: Chứa 5.000 phim 4K trên một tinh thể bé hơn đầu ngón tay?
Sony tuyên bố hợp tác gây chấn động ngành game, mang tính năng độc quyền trên AMD RX 9000 đến PS5 Pro, vạch ra tương lai cho PS6
Startup xe điện Dat Bike đã không còn "trong tay” người Việt
Trung Quốc tự đẩy mình vào 'thời khắc sinh tử': 300 startup xe điện chỉ còn 7 hãng lớn có thể tồn tại, chiến trường xe điện khốc liệt hơn bất kỳ lúc nào
Chuyên gia Phạm Chi Lan chỉ ra 4 điểm yếu của các nhà sáng lập Việt: Nhiều startup cho rằng xuất khẩu được mới 'oai', trong khi thị trường nội còn khó hơn ngoại
Startup KAMEREO ‘ấm bụng’ trong ‘mùa đông gọi vốn’: Hoàn tất vòng Series B với 7,8 triệu USD từ 5 ‘đồng hương’ Nhật Bản
Founder - CEO Amslink: Kiến tạo tương lai Anh ngữ cho thế hệ trẻ Việt
CASTI Awards 2024 - Tôn vinh sản phẩm khoa học, công nghệ và đổi mới sáng tạo
Siêu thị số  
 
Thuật toán học tăng cường cải tiến dựa trên xu hướng dữ liệu ứng dụng trong ra quyết định giao dịch thị trường tiền điện tử
Sự phát triển nhanh chóng của thị trường tiền điện tử đặt ra yêu cầu cấp thiết đối với các phương pháp ra quyết định giao dịch có khả năng thích ứng với tính biến động cao và phi tuyến của dữ liệu giá. Trong bối cảnh đó, học tăng cường được xem là một hướng tiếp cận tiềm năng nhờ khả năng học trực tiếp thông qua tương tác với môi trường mà không cần dữ liệu gán nhãn. Tuy nhiên, việc chỉ sử dụng học tăng cường thuần túy thường gặp hạn chế trong việc kiểm soát rủi ro và tối ưu lợi nhuận khi áp dụng vào thị trường tài chính thực tế.


 
Công nghệ 4.0  
 
Châm cứu, sắc thuốc bằng AI
Y học cổ truyền Trung Quốc, một lĩnh vực vốn được coi là khó chuẩn hóa và khó số hóa, đang thay đổi căn bản nhờ ứng dụng AI, từ chẩn đoán đến bào chế thuốc.


 
Điện tử  
 
NVIDIA bỏ xa đối thủ 9 lần trong bài kiểm tra AI Jensen Huang gọi là "khắt khe nhất", và lý do không phải chip Blackwell mới
Trong kỳ MLPerf Inference v6.0, NVIDIA là nhà sản xuất duy nhất nộp kết quả DeepSeek-R1 — đồng thời ghi nhận mức tăng 2,7 lần thông lượng token chỉ nhờ cập nhật phần mềm, không thay đổi phần cứng.


 
Tin học  
 
Thuật toán học tăng cường cải tiến dựa trên xu hướng dữ liệu ứng dụng trong ra quyết định giao dịch thị trường tiền điện tử
Sự phát triển nhanh chóng của thị trường tiền điện tử đặt ra yêu cầu cấp thiết đối với các phương pháp ra quyết định giao dịch có khả năng thích ứng với tính biến động cao và phi tuyến của dữ liệu giá. Trong bối cảnh đó, học tăng cường được xem là một hướng tiếp cận tiềm năng nhờ khả năng học trực tiếp thông qua tương tác với môi trường mà không cần dữ liệu gán nhãn. Tuy nhiên, việc chỉ sử dụng học tăng cường thuần túy thường gặp hạn chế trong việc kiểm soát rủi ro và tối ưu lợi nhuận khi áp dụng vào thị trường tài chính thực tế.


 



© Copyright 2020 Trung tâm Khởi nghiệp và Đổi mới sáng tạo - Sở Khoa học và Công nghệ TP. Cần Thơ
Địa chỉ: 118/3 Trần Phú - Phường Cái Khế - thành phố Cần Thơ
Giấy phép số: 05/ GP-TTĐT, do Sở Thông tin và Truyền Thông thành phố Cần Thơ cấp ngày 23/5/2017
Trưởng Ban biên tập: Ông Vũ Minh Hải - Giám đốc Trung tâm Khởi nghiệp và Đổi mới sáng tạo - Sở Khoa học & Công nghệ TP. Cần Thơ
Ghi rõ nguồn www.trithuckhoahoc.vn khi bạn sử dụng lại thông tin từ website này