Trong một bài viết vừa đăng tải trên trang cá nhân, Dario Amodei – CEO của Anthropic, công ty đứng sau chatbot Claude – đã thừa nhận một điều tưởng như đùa mà lại không hề đùa: không ai thực sự hiểu rõ cách AI hoạt động. Và đây không phải là một tuyên bố vu vơ, mà đến từ người đứng đầu một trong những phòng thí nghiệm AI hàng đầu thế giới.
"Khi một hệ thống AI tạo sinh thực hiện một việc gì đó, như tóm tắt một tài liệu tài chính, chúng ta không hề biết, ở mức độ cụ thể hay chính xác, tại sao nó đưa ra những lựa chọn đó – tại sao nó chọn từ ngữ này thay vì từ ngữ khác, hoặc tại sao đôi khi nó mắc lỗi dù thường xuyên chính xác," CEO Anthropic viết.
Ngắn gọn mà nói: AI có thể làm việc rất giỏi, nhưng lý do đằng sau mỗi lựa chọn của nó vẫn là một “hộp đen” đầy bí ẩn. Và chính điều này khiến cả những người trong ngành cũng phải bất an.
“Những người ngoài ngành AI có thể ngạc nhiên khi biết rằng ngay cả những người xây dựng công nghệ cũng không hiểu cách hoạt động của chính những sáng tạo AI của họ,” Amodei viết thêm, và thừa nhận “bất kỳ ai lo ngại về sự thiếu hiểu biết này đều có quyền lo lắng.”
Để đối mặt với vấn đề này, Amodei đề xuất một giải pháp mang tính hình ảnh: tạo ra một “MRI cho AI” – tức là một công cụ cho phép chúng ta “soi” vào não bộ của các mô hình AI trong thập kỷ tới. Mục tiêu không chỉ là hiểu rõ cách chúng vận hành, mà còn nhằm kiểm soát, ngăn ngừa các rủi ro tiềm ẩn.
“Sự thiếu hiểu biết này về cơ bản là chưa từng có trong lịch sử công nghệ,” ông nhấn mạnh.
Ít ai biết rằng, chính những lo ngại về vấn đề an toàn là lý do khiến Amodei và chị gái Daniela rời OpenAI vào năm 2020. Họ quan ngại rằng công ty do Sam Altman điều hành đang ưu tiên lợi nhuận hơn là trách nhiệm an toàn. Không lâu sau đó, họ cùng năm đồng nghiệp thành lập Anthropic – với mục tiêu xây dựng AI an toàn hơn và minh bạch hơn.
Hiện nay, Amodei cho biết Anthropic đang tập trung nghiên cứu cả về cách điều hướng AI phục vụ nhân loại, và cả khả năng đầy hứa hẹn:
“các nhà nghiên cứu cuối cùng có thể hiểu được cách hoạt động bên trong của các hệ thống này trước khi các mô hình đạt đến mức độ sức mạnh áp đảo.”
Để chứng minh nỗ lực đó, ông kể về một thí nghiệm gần đây của công ty: một “đội đỏ” được giao nhiệm vụ cài lỗi vào mô hình AI, còn các “đội xanh” sẽ tìm và phân tích sai sót. Kết quả khá tích cực:
“Nhiều đội xanh đã thành công trong việc phát hiện vấn đề, một số thậm chí đã áp dụng hiệu quả các công cụ diễn giải trong quá trình điều tra.”
Dù những công cụ này còn cần phát triển thêm, thí nghiệm cho thấy một điều quan trọng: Anthropic không chỉ phát triển AI, mà còn đang nghiêm túc tìm cách hiểu rõ chúng từ bên trong – điều mà ít công ty công nghệ sẵn sàng làm đến cùng.
Amodei kết bài viết của mình bằng một tuyên bố mạnh mẽ:
“AI mạnh mẽ sẽ định hình vận mệnh của nhân loại, và chúng ta xứng đáng hiểu được những sáng tạo của chính mình trước khi chúng biến đổi triệt để nền kinh tế, cuộc sống và tương lai của chúng ta.”
Một lời cảnh báo không dành riêng cho giới kỹ thuật, mà cho tất cả chúng ta – những người đang sống trong kỷ nguyên mà công nghệ có thể vừa là công cụ, vừa là câu đố lớn nhất của thời đại.
|