Lượt truy cập:
Điện tử [ Đăng ngày (04/04/2026) ]
Kết hợp hệ điều hành robot với LLM để điều khiển bằng ngôn ngữ tự nhiên
Trong nhiều thập kỷ qua, các nhà nghiên cứu robot đã phát triển nhiều thế hệ robot ngày càng tiên tiến, có khả năng tự động thực hiện các nhiệm vụ trong đời sống thực. Để có thể triển khai trong môi trường thực tế như không gian công cộng, gia đình hay văn phòng, robot cần hiểu và thực hiện chính xác các chỉ dẫn từ con người.

Mới đây, nhóm nghiên cứu tại Huawei Noah’s Ark Lab (London), Đại học Kỹ thuật Darmstadt và ETH ZuTrong nhiều thập kỷ qua, các nhà nghiên cứu robot đã phát triển nhiều thế hệ robot ngày càng tiên tiến, có khả năng tự động thực hiện các nhiệm vụ trong đời sống thực. Để có thể triển khai trong môi trường thực tế như không gian công cộng, gia đình hay văn phòng, robot cần hiểu và thực hiện chính xác các chỉ dẫn từ con người.

rich đã giới thiệu một khung làm việc mới kết hợp hệ điều hành robot (ROS) với mô hình ngôn ngữ lớn (LLM). Công trình được công bố trên Nature Machine Intelligence cho thấy cách kết nối LLM với ROS giúp robot dịch chỉ dẫn ngôn ngữ tự nhiên thành hành động cụ thể, mở ra hướng đi mới cho trí tuệ nhân tạo hiện thân (embodied AI).

“Robot tự động có khả năng biến chỉ dẫn ngôn ngữ tự nhiên thành hành động vật lý đáng tin cậy vẫn là thách thức trung tâm của AI. Chúng tôi chứng minh rằng việc kết nối LLM với ROS tạo ra một khung làm việc linh hoạt cho trí tuệ hiện thân,” – Christopher E. Mower và cộng sự viết.

Khung làm việc này cho phép LLM xử lý chỉ dẫn như “nhặt khối màu xanh và đặt lên kệ màu đen”, sau đó phân rã thành các bước nhỏ và chuyển thành hành động thông qua ROS. Có hai cách dịch lệnh:

Inline code: LLM viết các đoạn mã nhỏ trực tiếp điều khiển robot.

Behavior tree: Tổ chức hành động thành chuỗi có cấu trúc, kèm phương án thay thế nếu một bước thất bại.

Ngoài ra, hệ thống có thể học kỹ năng mới qua học bắt chước (imitation learning) và tối ưu liên tục nhờ phản hồi từ con người hoặc môi trường.

Nhóm nghiên cứu đã thử nghiệm trên nhiều loại robot với các nhiệm vụ khác nhau. Kết quả cho thấy framework này ổn định, mở rộng tốt và đa năng, từ các tác vụ dài hạn, sắp xếp vật thể trên bàn, tối ưu nhiệm vụ động cho đến điều khiển từ xa.

Đáng chú ý, toàn bộ kết quả đạt được đều sử dụng LLM mã nguồn mở đã được huấn luyện sẵn, cho thấy tiềm năng ứng dụng rộng rãi mà không cần mô hình độc quyền.

Trong thời gian tới, framework này có thể được mở rộng sang nhiều loại robot hơn, xử lý các nhiệm vụ phức tạp hơn trong môi trường động. Đồng thời, nó có thể truyền cảm hứng cho các giải pháp khác kết nối phần mềm điều khiển robot với LLM, đưa robot tiến gần hơn đến khả năng tương tác tự nhiên với con người.

ntbtra
Theo https://techxplore.com
In bài viết  
Bookmark
Ý kiến của bạn




© Copyright 2020 Trung tâm Khởi nghiệp và Đổi mới sáng tạo - Sở Khoa học và Công nghệ TP. Cần Thơ
Địa chỉ: 118/3 Trần Phú - Phường Cái Khế - thành phố Cần Thơ
Giấy phép số: 05/ GP-TTĐT, do Sở Thông tin và Truyền Thông thành phố Cần Thơ cấp ngày 23/5/2017
Trưởng Ban biên tập: Ông Vũ Minh Hải - Giám đốc Trung tâm Khởi nghiệp và Đổi mới sáng tạo - Sở Khoa học & Công nghệ TP. Cần Thơ
Ghi rõ nguồn www.trithuckhoahoc.vn khi bạn sử dụng lại thông tin từ website này
Tin mới
Muốn nâng tầm nhiếp ảnh di động? Đây là thiết lập camera Vivo X300 cho kết quả đỉnh cao
Vivo X300 được thiết kế dành cho những người yêu thích nhiếp ảnh, mong muốn hiệu năng camera ở cấp độ flagship ngay trên smartphone. Nhiều người dùng còn nhận...
Phụ gia phân tử giúp pin mặt trời tandem silicon–perovskite đạt hiệu suất 32,76%
Pin mặt trời – thiết bị chuyển đổi ánh sáng mặt trời thành điện năng – từ lâu đã được xem là giải pháp năng lượng sạch đầy tiềm năng....
Kết hợp hệ điều hành robot với LLM để điều khiển bằng ngôn ngữ tự nhiên
Trong nhiều thập kỷ qua, các nhà nghiên cứu robot đã phát triển nhiều thế hệ robot ngày càng tiên tiến, có khả năng tự động thực hiện các nhiệm...
Thiết kế memristor mới sử dụng gradient oxy nội tại để mang lại sự ổn định cho học tăng cường
Một nhóm nghiên cứu tại Trung Quốc và Hồng Kông vừa công bố trên Nature Communications một thiết kế memristor mới với gradient oxy tích hợp sẵn, giúp tạo ra...
Ánh sáng bẻ cong mạng tinh thể perovskite, mở ra hướng đi cho thiết bị mới
Một nghiên cứu mới từ Đại học California, Davis (UC Davis) cho thấy vật liệu perovskite halide có khả năng thay đổi hình dạng mạng tinh thể một cách nhanh...
Nexperia Trung Quốc tiến gần tới sản xuất chip hoàn toàn nội địa
Đơn vị tại Trung Quốc của Nexperia – hãng sản xuất chip có trụ sở chính tại Hà Lan nhưng thuộc sở hữu của Wingtech (Trung Quốc) – sắp đạt...
Qualcomm nhân đôi bộ nhớ đệm chip flagship mới, bóng ma
Snapdragon 8 Elite Gen 6 Pro được cho là dùng cụm CPU kiểu ba nhóm hoàn toàn mới, giúp tổng bộ nhớ đệm L2 tăng từ 24 MB lên 48...
Intel sắp vượt AMD về số nhân chip laptop, nhưng cần đợi đến 2027
Nova Lake-HX dùng kiến trúc lai kết hợp nhân Coyote Cove và Arctic Wolf, ra mắt tại CES 2027 cùng card RTX 60 của NVIDIA. Intel cũng đang phát triển...
NVIDIA bỏ xa đối thủ 9 lần trong bài kiểm tra AI Jensen Huang gọi là "khắt khe nhất", và lý do không phải chip Blackwell mới
Trong kỳ MLPerf Inference v6.0, NVIDIA là nhà sản xuất duy nhất nộp kết quả DeepSeek-R1 — đồng thời ghi nhận mức tăng 2,7 lần thông lượng token chỉ nhờ...
AI trong nhà thông minh? Roborock Saros 20 cho thấy công nghệ thực sự hữu ích
Trong khi nhiều sản phẩm gắn mác “AI” nhưng không mang lại giá trị rõ rệt, robot hút bụi thường là ví dụ điển hình. Tuy nhiên, Roborock Saros 20...
Gemma 4: Google và NVIDIA hợp sức đưa AI mạnh về máy tính cá nhân
Gemma 4 gồm bốn biến thể từ E2B đến 31B, có thể chạy hoàn toàn offline trên Jetson Orin Nano hoặc GPU RTX, hỗ trợ đa phương thức, hơn 35...
iPad Pro M4: Màn hình OLED, Magic Keyboard & sức mạnh năng suất thế hệ mới
iPad Pro M4 định nghĩa lại trải nghiệm lai giữa tablet và laptop, kết hợp hiệu năng mạnh mẽ với thiết kế siêu mỏng nhẹ. Với chip M4 và màn...
Công nghệ không dây sử dụng laser đạt tốc độ siêu nhanh
Các nhà nghiên cứu đã phát triển một con chip nhỏ xíu chứa hàng chục tia laser thu nhỏ có thể truyền tải lượng dữ liệu khổng lồ cùng một...
Thủ thuật ánh sáng làm thay đổi hoàn toàn mã hóa lượng tử
Bằng cách khai thác hiện tượng quang học từ thế kỷ 19 gọi là hiệu ứng Talbot, các nhà nghiên cứu đã phát triển một hệ thống gửi thông tin...
-->