Trí tuệ nhân tạo [ Đăng ngày (07/05/2025) ]
Một trong những “cha đẻ” của Chatbot Ai lớn nhất thế giới: Chẳng ai hiểu AI hoạt động như thế nào
Nếu bạn từng gõ lên Google câu hỏi “Chatbot AI hoạt động như thế nào?”, thì xin chúc mừng: bạn không cô đơn. Ngay cả những người xây dựng ra chúng cũng đang… không chắc lắm.

Trong một bài viết vừa đăng tải trên trang cá nhân, Dario Amodei – CEO của Anthropic, công ty đứng sau chatbot Claude – đã thừa nhận một điều tưởng như đùa mà lại không hề đùa: không ai thực sự hiểu rõ cách AI hoạt động. Và đây không phải là một tuyên bố vu vơ, mà đến từ người đứng đầu một trong những phòng thí nghiệm AI hàng đầu thế giới.

"Khi một hệ thống AI tạo sinh thực hiện một việc gì đó, như tóm tắt một tài liệu tài chính, chúng ta không hề biết, ở mức độ cụ thể hay chính xác, tại sao nó đưa ra những lựa chọn đó – tại sao nó chọn từ ngữ này thay vì từ ngữ khác, hoặc tại sao đôi khi nó mắc lỗi dù thường xuyên chính xác," CEO Anthropic viết.

Ngắn gọn mà nói: AI có thể làm việc rất giỏi, nhưng lý do đằng sau mỗi lựa chọn của nó vẫn là một “hộp đen” đầy bí ẩn. Và chính điều này khiến cả những người trong ngành cũng phải bất an.

“Những người ngoài ngành AI có thể ngạc nhiên khi biết rằng ngay cả những người xây dựng công nghệ cũng không hiểu cách hoạt động của chính những sáng tạo AI của họ,” Amodei viết thêm, và thừa nhận “bất kỳ ai lo ngại về sự thiếu hiểu biết này đều có quyền lo lắng.”

Để đối mặt với vấn đề này, Amodei đề xuất một giải pháp mang tính hình ảnh: tạo ra một “MRI cho AI” – tức là một công cụ cho phép chúng ta “soi” vào não bộ của các mô hình AI trong thập kỷ tới. Mục tiêu không chỉ là hiểu rõ cách chúng vận hành, mà còn nhằm kiểm soát, ngăn ngừa các rủi ro tiềm ẩn.

“Sự thiếu hiểu biết này về cơ bản là chưa từng có trong lịch sử công nghệ,” ông nhấn mạnh.

Ít ai biết rằng, chính những lo ngại về vấn đề an toàn là lý do khiến Amodei và chị gái Daniela rời OpenAI vào năm 2020. Họ quan ngại rằng công ty do Sam Altman điều hành đang ưu tiên lợi nhuận hơn là trách nhiệm an toàn. Không lâu sau đó, họ cùng năm đồng nghiệp thành lập Anthropic – với mục tiêu xây dựng AI an toàn hơn và minh bạch hơn.

Hiện nay, Amodei cho biết Anthropic đang tập trung nghiên cứu cả về cách điều hướng AI phục vụ nhân loại, và cả khả năng đầy hứa hẹn:

“các nhà nghiên cứu cuối cùng có thể hiểu được cách hoạt động bên trong của các hệ thống này trước khi các mô hình đạt đến mức độ sức mạnh áp đảo.”

Để chứng minh nỗ lực đó, ông kể về một thí nghiệm gần đây của công ty: một “đội đỏ” được giao nhiệm vụ cài lỗi vào mô hình AI, còn các “đội xanh” sẽ tìm và phân tích sai sót. Kết quả khá tích cực:

“Nhiều đội xanh đã thành công trong việc phát hiện vấn đề, một số thậm chí đã áp dụng hiệu quả các công cụ diễn giải trong quá trình điều tra.”

Dù những công cụ này còn cần phát triển thêm, thí nghiệm cho thấy một điều quan trọng: Anthropic không chỉ phát triển AI, mà còn đang nghiêm túc tìm cách hiểu rõ chúng từ bên trong – điều mà ít công ty công nghệ sẵn sàng làm đến cùng.

Amodei kết bài viết của mình bằng một tuyên bố mạnh mẽ:

“AI mạnh mẽ sẽ định hình vận mệnh của nhân loại, và chúng ta xứng đáng hiểu được những sáng tạo của chính mình trước khi chúng biến đổi triệt để nền kinh tế, cuộc sống và tương lai của chúng ta.”

Một lời cảnh báo không dành riêng cho giới kỹ thuật, mà cho tất cả chúng ta – những người đang sống trong kỷ nguyên mà công nghệ có thể vừa là công cụ, vừa là câu đố lớn nhất của thời đại.

htquyen
Theo Genk
In bài viết  
Bookmark
Ý kiến của bạn

Xem nhiều

Tiêu điểm

4 triệu chứng chính của ung thư đại tràng
Bộ não bị lão hóa nhanh là do ảnh hưởng từ 64 gene
Ứng dụng di động hỗ trợ phục hồi chức năng liệt nửa người do đột quỵ
Microsoft cáo buộc nhóm tin tặc đứng sau mạng lưới Deepfake AI
Công nghệ lưu trữ lượng tử vừa đạt đột phá: Chứa 5.000 phim 4K trên một tinh thể bé hơn đầu ngón tay?
Sony tuyên bố hợp tác gây chấn động ngành game, mang tính năng độc quyền trên AMD RX 9000 đến PS5 Pro, vạch ra tương lai cho PS6
Đại học Harvard công bố 4 loại trái cây giúp hỗ trợ sống 'trường thọ' nên ăn thường xuyên
AI có thể thay thế người thầy?
Ăn nhiều cá có thể giảm nguy cơ khuyết tật do đa xơ cứng
Startup xe điện Dat Bike đã không còn "trong tay” người Việt
Trung Quốc tự đẩy mình vào 'thời khắc sinh tử': 300 startup xe điện chỉ còn 7 hãng lớn có thể tồn tại, chiến trường xe điện khốc liệt hơn bất kỳ lúc nào
Chuyên gia Phạm Chi Lan chỉ ra 4 điểm yếu của các nhà sáng lập Việt: Nhiều startup cho rằng xuất khẩu được mới 'oai', trong khi thị trường nội còn khó hơn ngoại
Startup KAMEREO ‘ấm bụng’ trong ‘mùa đông gọi vốn’: Hoàn tất vòng Series B với 7,8 triệu USD từ 5 ‘đồng hương’ Nhật Bản
Founder - CEO Amslink: Kiến tạo tương lai Anh ngữ cho thế hệ trẻ Việt
Can thiệp bào thai bằng Laser đốt thông nối mạch máu, giảm ối cứu sống thành công 2 trẻ song sinh cực non
Siêu thị số  
 
Google phát hành lỗ hổng zero-day định danh CVE-2025-2783
Google vừa phát hành bản vá khẩn cấp cho trình duyệt Chrome nhằm khắc phục một lỗ hổng zero-day nghiêm trọng đầu tiên được phát hiện trong năm 2025. Lỗ hổng này định danh CVE-2025-2783 đã bị tin tặc khai thác trong thực tế.


 
Công nghệ 4.0  
 
Wikipedia ứng dụng AI để giảm tải cho biên tập viên tình nguyện
Wikipedia vừa công bố kế hoạch tích hợp trí tuệ nhân tạo tạo sinh vào quy trình làm việc của đội ngũ biên tập, không nhằm thay thế con người mà hỗ trợ họ hiệu quả hơn.


 
Tin học  
 
Google phát hành lỗ hổng zero-day định danh CVE-2025-2783
Google vừa phát hành bản vá khẩn cấp cho trình duyệt Chrome nhằm khắc phục một lỗ hổng zero-day nghiêm trọng đầu tiên được phát hiện trong năm 2025. Lỗ hổng này định danh CVE-2025-2783 đã bị tin tặc khai thác trong thực tế.


 



© Copyright 2020 Trung tâm Thông tin Khoa học và Công nghệ - Sở Khoa học & Công nghệ TP. Cần Thơ
Địa chỉ: 118/3 Trần Phú - Phường Cái Khế - Quận Ninh Kiều - thành phố Cần Thơ
Giấy phép số: 05/ GP-TTĐT, do Sở Thông tin và Truyền Thông thành phố Cần Thơ cấp ngày 23/5/2017
Trưởng Ban biên tập: Ông Vũ Minh Hải - Giám Đốc Trung tâm Thông tin Khoa học và Công nghệ - Sở Khoa học & Công nghệ TP. Cần Thơ
Ghi rõ nguồn www.trithuckhoahoc.vn khi bạn sử dụng lại thông tin từ website này
-->