Công nghệ [ Đăng ngày (28/01/2026) ]
Dạy robot lập bản đồ môi trường quy mô lớn
Một robot tìm kiếm công nhân bị mắc kẹt trong một đường hầm mỏ sập một phần phải nhanh chóng tạo ra bản đồ hiện trường và xác định vị trí của chính nó khi di chuyển qua địa hình nguy hiểm.

Gần đây, các nhà khoa học đã xây dựng những mô hình học máy mạnh mẽ để thực hiện nhiệm vụ phức tạp này chỉ dựa trên hình ảnh từ camera gắn trên robot. Tuy nhiên, ngay cả những mô hình tốt nhất cũng chỉ xử lý được vài chục hình ảnh mỗi lần. Trong các tình huống thảm họa thực tế, nơi từng giây đều có giá trị, robot cứu hộ cần di chuyển nhanh qua khu vực rộng lớn và xử lý hàng nghìn hình ảnh để hoàn thành nhiệm vụ.

Để khắc phục hạn chế này, các nhà nghiên cứu tại MIT đã kết hợp ý tưởng từ các mô hình thị giác AI hiện đại với thị giác máy tính cổ điển, phát triển một hệ thống mới có khả năng xử lý số lượng hình ảnh tùy ý. Hệ thống này có thể tạo bản đồ 3D chính xác của những cảnh phức tạp, như một hành lang văn phòng đông đúc, chỉ trong vài giây.

Thay vì xây dựng toàn bộ bản đồ cùng lúc, hệ thống tạo ra các bản đồ con nhỏ, sau đó “khâu” chúng lại để hình thành bản đồ 3D tổng thể, đồng thời liên tục cập nhật vị trí của robot theo thời gian thực.

Không giống nhiều phương pháp khác, kỹ thuật này không yêu cầu camera đã được hiệu chuẩn hay cần chuyên gia tinh chỉnh một hệ thống phức tạp. Chính sự đơn giản trong triển khai, cùng với tốc độ và chất lượng tái dựng 3D, giúp phương pháp này dễ dàng mở rộng cho các ứng dụng thực tế.

Ngoài hỗ trợ robot tìm kiếm – cứu nạn, công nghệ này còn có thể được dùng cho các ứng dụng thực tế mở rộng (XR) trên thiết bị đeo như kính VR, hoặc giúp robot công nghiệp nhanh chóng định vị và vận chuyển hàng hóa trong kho.

“Để robot có thể thực hiện những nhiệm vụ ngày càng phức tạp, chúng cần những biểu diễn bản đồ thế giới xung quanh cũng phức tạp hơn,” Dominic Maggio, nghiên cứu sinh MIT và tác giả chính của công trình, cho biết. “Nhưng đồng thời, chúng tôi không muốn việc triển khai các bản đồ này trở nên khó khăn trong thực tế. Nghiên cứu của chúng tôi cho thấy hoàn toàn có thể tạo ra một mô hình tái dựng 3D chính xác chỉ trong vài giây bằng một công cụ ‘cắm là chạy’.”

Cùng tham gia nghiên cứu có Hyungtae Lim, nghiên cứu sau tiến sĩ, và tác giả cao cấp Luca Carlone, phó giáo sư Khoa Hàng không – Vũ trụ MIT, nhà nghiên cứu chính tại Phòng thí nghiệm Hệ thống Thông tin và Quyết định (LIDS), đồng thời là giám đốc Phòng thí nghiệm MIT SPARK. Công trình sẽ được trình bày tại Hội nghị Neural Information Processing Systems (NeurIPS).

Bài toán SLAM và hướng tiếp cận mới

Trong nhiều năm, giới nghiên cứu đã nỗ lực giải quyết một bài toán cốt lõi trong điều hướng robot mang tên SLAM (Simultaneous Localization and Mapping) – vừa lập bản đồ môi trường, vừa xác định vị trí của robot trong chính môi trường đó.

Các phương pháp tối ưu hóa truyền thống thường không hoạt động tốt trong những bối cảnh phức tạp, hoặc đòi hỏi camera của robot phải được hiệu chuẩn từ trước. Để tránh những hạn chế này, nhiều nhóm nghiên cứu đã sử dụng mô hình học máy để học trực tiếp nhiệm vụ SLAM từ dữ liệu.

Dù dễ triển khai hơn, ngay cả các mô hình tiên tiến nhất hiện nay cũng chỉ xử lý được khoảng 60 hình ảnh mỗi lần, khiến chúng không phù hợp với các tình huống robot phải di chuyển nhanh và xử lý hàng nghìn hình ảnh.

Giải pháp của MIT là chia nhỏ bài toán: hệ thống tạo các bản đồ con thay vì dựng toàn bộ bản đồ ngay lập tức, rồi ghép chúng lại thành một mô hình 3D hoàn chỉnh. Cách làm này cho phép xử lý từng cụm hình ảnh nhỏ, nhưng vẫn tái dựng được những không gian lớn trong thời gian ngắn.

“Ban đầu, đây có vẻ là một giải pháp rất đơn giản, nhưng khi tôi thử nghiệm lần đầu, kết quả lại không tốt như mong đợi,” Maggio chia sẻ.

Khi tìm hiểu nguyên nhân, anh đã nghiên cứu lại các tài liệu thị giác máy tính từ những năm 1980–1990 và nhận ra rằng các sai lệch do mô hình học máy tạo ra khiến việc căn chỉnh các bản đồ con trở nên phức tạp hơn.

Các phương pháp truyền thống căn chỉnh bản đồ con bằng cách xoay và tịnh tiến chúng cho đến khi khớp. Tuy nhiên, các mô hình AI mới có thể tạo ra những biến dạng mơ hồ, chẳng hạn như tường trong bản đồ 3D bị cong hoặc kéo giãn nhẹ. Khi đó, việc chỉ xoay và tịnh tiến không còn hiệu quả.

“Chúng tôi cần đảm bảo rằng tất cả các bản đồ con đều bị biến dạng theo một cách nhất quán, để có thể căn chỉnh chúng với nhau một cách chính xác,” Carlone giải thích.

Linh hoạt hơn nhờ toán học cổ điển

Vay mượn ý tưởng từ thị giác máy tính cổ điển, nhóm nghiên cứu đã phát triển một kỹ thuật toán học linh hoạt hơn, cho phép biểu diễn và hiệu chỉnh các dạng biến dạng trong bản đồ con. Bằng cách áp dụng các phép biến đổi toán học phù hợp, hệ thống có thể căn chỉnh các bản đồ con chính xác hơn, khắc phục được sự mơ hồ do mô hình học máy tạo ra.

Từ dữ liệu hình ảnh đầu vào, hệ thống xuất ra bản tái dựng 3D của môi trường cùng với ước lượng vị trí camera, thông tin mà robot sử dụng để tự định vị.

“Khi Dominic nảy ra ý tưởng kết nối hai thế giới — phương pháp học máy và tối ưu hóa truyền thống — việc triển khai trở nên khá thẳng thắn,” Carlone nói. “Một giải pháp vừa đơn giản vừa hiệu quả như vậy có tiềm năng ứng dụng rất rộng.”

Hệ thống này nhanh hơn và sai số thấp hơn so với các phương pháp khác, mà không cần camera đặc biệt hay công cụ bổ sung. Nhóm nghiên cứu đã tạo ra các bản đồ 3D gần thời gian thực của những không gian phức tạp, như bên trong Nhà nguyện MIT, chỉ từ các đoạn video ngắn quay bằng điện thoại di động.

Sai số trung bình của các mô hình tái dựng 3D này dưới 5 cm.

Trong tương lai, nhóm nghiên cứu muốn nâng cao độ ổn định của phương pháp trong những môi trường đặc biệt phức tạp và tiến tới triển khai trực tiếp trên robot hoạt động trong các điều kiện khắc nghiệt.

“Hiểu sâu về hình học truyền thống mang lại lợi thế rất lớn,” Carlone kết luận. “Khi bạn thực sự nắm được bản chất của mô hình, bạn có thể đạt kết quả tốt hơn rất nhiều và mở rộng quy mô một cách hiệu quả.”

tnxmai
Theo https://www.technology.org/2025/11/14/teaching-robots-to-map-large-environments/
In bài viết  
Bookmark
Ý kiến của bạn

Công nghệ mới  
   

Tiêu điểm

Bộ não bị lão hóa nhanh là do ảnh hưởng từ 64 gene
Ứng dụng di động hỗ trợ phục hồi chức năng liệt nửa người do đột quỵ
Đại học Harvard công bố 4 loại trái cây giúp hỗ trợ sống 'trường thọ' nên ăn thường xuyên
Can thiệp bào thai bằng Laser đốt thông nối mạch máu, giảm ối cứu sống thành công 2 trẻ song sinh cực non
Lần đầu tiên BV hữu nghị Việt Nam-Cuba Đồng Hới ứng dụng keo dán sinh học trong phẫu thuật mắt
Hội thảo “Thúc đẩy ứng dụng công nghệ thực tế ảo, thực tế ảo tăng cường phục vụ phát triển du lịch thành phố Cần Thơ và vùng đồng bằng sông Cửu Long” sắp diễn ra, với nhiều nội dung hấp dẫn đang chờ đón bạn!
Cần Thơ tham gia Triển lãm Quốc tế sản phẩm, máy móc, thiết bị nông nghiệp Việt Nam - Growtech Vietnam 2024
Sắp diễn ra Triển lãm Quốc tế sản phẩm, máy móc, thiết bị nông nghiệp Việt Nam - Growtech Vietnam 2024
Phát hiện cơn đau bằng AI
Máy tiêm laser cung cấp thuốc trực tiếp
Thiết bị AI Audiologist sàng lọc thính lực
Liệu pháp điều trị loét bàn chân do tiểu đường
Tai nghe laser mới có thể đánh giá nguy cơ đột quỵ
Sử dụng hình ảnh 3D để tái chế rác thải nhựa
Mô hình robot mới đưa ra giải pháp chọn và đặt chính xác trong ứng dụng tự động hóa

Video




© Copyright 2020 Trung tâm Khởi nghiệp và Đổi mới sáng tạo - Sở Khoa học và Công nghệ TP. Cần Thơ
Địa chỉ: 118/3 Trần Phú - Phường Cái Khế - thành phố Cần Thơ
Giấy phép số: 05/ GP-TTĐT, do Sở Thông tin và Truyền Thông thành phố Cần Thơ cấp ngày 23/5/2017
Trưởng Ban biên tập: Ông Vũ Minh Hải - Giám Đốc Trung tâm Thông tin Khoa học và Công nghệ - Sở Khoa học & Công nghệ TP. Cần Thơ
Ghi rõ nguồn www.trithuckhoahoc.vn khi bạn sử dụng lại thông tin từ website này
-->