Trí tuệ nhân tạo
[ Đăng ngày (28/02/2026) ]
|
|
Huấn luyện robot bằng phản hồi tự nhiên và nhẹ nhàng từ con người
|
|
|
Nghiên cứu do tác giả Erdem Bıyık thuộc Khoa Khoa học Máy tính, Đại học Nam California, Los Angeles, Hoa Kỳ thực hiện.
|
Hình minh họa
Các mô hình robot đa năng hứa hẹn khả năng ứng dụng rộng rãi trong nhiều lĩnh vực nhưng hiện tại đòi hỏi phải có sự hướng dẫn chuyên môn sâu rộng của các chuyên gia để chuyên biệt hóa nhiệm vụ, điều này tạo ra gánh nặng tốn kém và không thực tế cho việc triển khai trong thế giới thực.
Trong bài viết này, tác giả trình bày các thuật toán cho phép người dùng không chuyên thích ứng và liên tục cải thiện các chính sách của robot thông qua các phương thức phản hồi tự nhiên và đơn giản, chẳng hạn như so sánh sở thích, xếp hạng, đánh giá, ngôn ngữ tự nhiên và sự trình diễn của chính người dùng, kết hợp chúng với các chiến lược học tập chủ động để tối đa hóa hiệu quả dữ liệu.
Tác giả cũng giới thiệu các phương pháp tận dụng sự can thiệp của con người trong thời gian thực như các tín hiệu huấn luyện phong phú, mô hình hóa cả thời gian và sự vắng mặt của chúng để liên tục tinh chỉnh các chính sách.
Các phương pháp của tác giả đạt được những tiến bộ đáng kể về hiệu quả lấy mẫu, khả năng thích ứng và tính thân thiện với người dùng, được chứng minh trên các nhiệm vụ robot mô phỏng và thực tế. Bằng cách điều chỉnh quá trình học tập của robot sao cho phù hợp với cách con người học hỏi một cách tự nhiên, tác giả hy vọng sẽ tiến tới các hệ thống tự động hóa cá nhân hóa hơn, có khả năng hơn và có thể triển khai trong môi trường hàng ngày. |
ctngoc
Theo Tạp chí AI, Tập 47 Số 1 (2026) DOI: 10.1002/aaai.70037 |