Tin học [ Đăng ngày (02/02/2026) ]
Phát triển ứng dụng phát hiện hư hỏng đường bộ theo thời gian thực
Hư hỏng mặt đường là một trong những nguyên nhân quan trọng ảnh hưởng trực tiếp đến an toàn giao thông và chi phí bảo trì hạ tầng. Các phương pháp kiểm tra truyền thống chủ yếu dựa trên khảo sát thủ công, không chỉ tốn nhiều thời gian, nhân lực mà còn thiếu tính liên tục và kịp thời. Trước bối cảnh đó, nghiên cứu này đề xuất một ứng dụng Android có khả năng phát hiện hư hỏng đường bộ theo thời gian thực dựa trên các mô hình học sâu phát hiện đối tượng. Trong nghiên cứu, hai mô hình Faster R-CNN và YOLOv12m được huấn luyện và đánh giá trên tập dữ liệu RDD2022 gồm hơn 47.000 ảnh chứa nhiều loại hư hỏng mặt đường. Kết quả thực nghiệm cho thấy Faster R-CNN đạt độ chính xác cao hơn đôi chút (mAP@50 = 66,5%) nhưng có tốc độ suy luận chậm (104 ms/ảnh), trong khi YOLOv12m có độ chính xác xấp xỉ (mAP@50 = 65%) nhưng thời gian xử lý nhanh hơn đáng kể (77 ms/ảnh). Nhờ ưu thế về tốc độ, YOLOv12m được lựa chọn để triển khai trong hệ thống phát hiện thời gian thực. Hệ thống được xây dựng theo mô hình máy chủ – máy khách, trong đó mô hình YOLOv12m được triển khai tại máy chủ và giao tiếp với ứng dụng Android thông qua WebSocket. Kết quả phát hiện được truyền và hiển thị trực tiếp trên giao diện người dùng. Giải pháp đề xuất cho thấy tính khả thi cao trong việc tự động hóa công tác giám sát hạ tầng giao thông, đồng thời tạo tiền đề cho các nghiên cứu và ứng dụng tiếp theo trong lĩnh vực thị giác máy tính và phát hiện hư hỏng đường bộ theo thời gian thực.

1. ĐẶT VẤN ĐỀ

Hệ thống giao thông đường bộ đóng vai trò then chốt trong sự phát triển kinh tế – xã hội. Tuy nhiên, trong quá trình khai thác, mặt đường thường xuyên xuất hiện các dạng hư hỏng như nứt dọc, nứt ngang, nứt mai rùa, ổ gà hoặc mờ vạch kẻ đường. Nếu không được phát hiện và khắc phục kịp thời, các hư hỏng này có thể gây mất an toàn giao thông, gia tăng chi phí bảo trì và làm giảm tuổi thọ công trình.

Hiện nay, việc kiểm tra và đánh giá tình trạng mặt đường chủ yếu dựa vào khảo sát trực tiếp của con người. Phương pháp này không chỉ tiêu tốn nhiều nguồn lực mà còn phụ thuộc lớn vào kinh nghiệm chủ quan, dẫn đến độ chính xác không đồng đều và khó mở rộng trên quy mô lớn. Do đó, việc nghiên cứu các giải pháp tự động, có khả năng phát hiện hư hỏng đường bộ một cách nhanh chóng và chính xác là yêu cầu cấp thiết.

Trong những năm gần đây, các mô hình học sâu phát hiện đối tượng như Faster R-CNN, SSD hay các phiên bản YOLO đã được ứng dụng hiệu quả trong nhiều bài toán thị giác máy tính. Tuy nhiên, phần lớn các nghiên cứu vẫn tập trung vào cải thiện độ chính xác mà chưa giải quyết triệt để yêu cầu xử lý thời gian thực, đặc biệt là khi triển khai trên các nền tảng di động.

YOLOv12 – phiên bản mới của họ YOLO – được giới thiệu với nhiều cải tiến về kiến trúc nhằm nâng cao đồng thời cả độ chính xác và tốc độ suy luận. Điều này mở ra tiềm năng lớn cho các ứng dụng phát hiện đối tượng thời gian thực. Từ đó, nghiên cứu này tập trung so sánh hiệu năng giữa YOLOv12m và Faster R-CNN trên bài toán phát hiện hư hỏng đường bộ, đồng thời xây dựng một hệ thống ứng dụng Android nhằm minh chứng khả năng triển khai thực tế.

2. CƠ SỞ LÝ THUYẾT

2.1. Mô hình YOLOv12

YOLOv12 là phiên bản mới được công bố năm 2025, kế thừa và phát triển từ các phiên bản YOLO trước đó. Kiến trúc tổng thể của YOLOv12 vẫn gồm ba thành phần chính là xương sống (backbone), cổ (neck) và đầu (head), nhưng được cải tiến đáng kể nhằm tối ưu hiệu suất.

Một điểm nổi bật của YOLOv12 là việc thay thế kiến trúc ELAN bằng R-ELAN, cho phép kết hợp các lớp tích chập sâu với kết nối dư, giúp cải thiện khả năng lan truyền gradient và tăng hiệu quả học đặc trưng. Bên cạnh đó, cơ chế Area Attention giúp mô hình không chỉ tập trung vào từng điểm ảnh riêng lẻ mà còn xét đến mối quan hệ vùng lân cận, từ đó nâng cao khả năng phát hiện các đối tượng nhỏ hoặc có biên không rõ ràng.

Ngoài ra, YOLOv12 còn tích hợp FlashAttention nhằm tối ưu quá trình tính toán trên GPU, giảm độ trễ và mức tiêu thụ bộ nhớ trong quá trình suy luận. Ở tầng đầu ra, mô hình loại bỏ hoàn toàn hộp neo (anchor box), cho phép dự đoán trực tiếp vị trí và kích thước đối tượng, giúp đơn giản hóa cấu trúc và tăng tính linh hoạt.

Trong nghiên cứu này, phiên bản YOLOv12m được lựa chọn do đạt được sự cân bằng hợp lý giữa độ chính xác, tốc độ xử lý và yêu cầu tài nguyên, phù hợp cho triển khai trong các hệ thống thời gian thực.

2.2. Mô hình Faster R-CNN

Faster R-CNN là một mô hình phát hiện đối tượng hai giai đoạn, được đánh giá cao về độ chính xác. Mô hình bao gồm mạng trích xuất đặc trưng, mạng đề xuất vùng (RPN), lớp gộp vùng ROI Pooling và khối phân loại – hồi quy cuối cùng.

Ưu điểm lớn nhất của Faster R-CNN là khả năng phát hiện chính xác các đối tượng nhỏ hoặc bị che khuất. Tuy nhiên, do quy trình xử lý gồm hai giai đoạn liên tiếp, tốc độ suy luận của mô hình thường chậm hơn so với các mô hình một giai đoạn như YOLO. Điều này khiến Faster R-CNN gặp hạn chế khi áp dụng trong các ứng dụng yêu cầu xử lý thời gian thực.

2.3. Dữ liệu và tiền xử lý

Nghiên cứu sử dụng tập dữ liệu RDD2022 gồm hơn 47.000 ảnh được thu thập từ nhiều quốc gia, bao gồm bảy loại hư hỏng đường bộ phổ biến. Dữ liệu được chia thành các tập huấn luyện và kiểm thử, đồng thời thực hiện các bước tiền xử lý phù hợp cho từng mô hình.

Đối với YOLOv12m, dữ liệu được chuyển sang định dạng phù hợp, chuẩn hóa kích thước ảnh và áp dụng các kịch bản tăng cường dữ liệu khác nhau. Với Faster R-CNN, dữ liệu được chuyển đổi sang định dạng COCO và chuẩn hóa theo yêu cầu của mô hình.

3. KẾT QUẢ NGHIÊN CỨU

3.1. So sánh YOLOv12m và Faster R-CNN

Kết quả thực nghiệm cho thấy Faster R-CNN đạt mAP@50 cao hơn YOLOv12m khoảng 1,5%, tuy nhiên thời gian xử lý của mô hình này chậm hơn đáng kể. Trong khi đó, YOLOv12m có tốc độ suy luận nhanh hơn, giúp tăng độ mượt và khả năng phản hồi của hệ thống thời gian thực.

Từ kết quả so sánh, YOLOv12m được lựa chọn làm mô hình phát hiện chính trong hệ thống nhờ khả năng cân bằng hợp lý giữa độ chính xác và tốc độ xử lý.

3.2. Ảnh hưởng của tăng cường dữ liệu

Các kịch bản tăng cường dữ liệu khác nhau được áp dụng nhằm đánh giá tác động đến hiệu năng của mô hình YOLOv12m. Kết quả cho thấy việc áp dụng tăng cường ở mức trung bình giúp cải thiện đáng kể độ chính xác và độ ổn định khi kiểm thử trên video thực tế. Ngược lại, tăng cường quá mạnh có thể gây nhiễu và làm giảm khả năng phân biệt giữa các lớp hư hỏng.

3.3. Triển khai ứng dụng Android

Ứng dụng Android được phát triển với khả năng chụp ảnh và quay video, truyền dữ liệu thời gian thực đến máy chủ thông qua WebSocket. Kết quả phát hiện được trả về dưới dạng JSON và hiển thị trực tiếp trên giao diện người dùng. Thử nghiệm trên thiết bị di động cho thấy hệ thống hoạt động ổn định, độ trễ chấp nhận được và phù hợp cho triển khai thực tế.

4. KẾT LUẬN

Nghiên cứu đã xây dựng thành công một hệ thống phát hiện hư hỏng đường bộ theo thời gian thực dựa trên mô hình YOLOv12m và ứng dụng Android. Kết quả thực nghiệm chứng minh rằng hệ thống đáp ứng tốt yêu cầu về tốc độ và độ chính xác, đồng thời có khả năng triển khai trong thực tế.

Trong tương lai, hệ thống có thể được mở rộng bằng cách tăng quy mô dữ liệu huấn luyện, tối ưu mô hình để chạy trực tiếp trên thiết bị di động và tích hợp thêm các chức năng quản lý, đánh giá mức độ hư hỏng nhằm hỗ trợ hiệu quả hơn cho công tác bảo trì hạ tầng giao thông.

nhahuy
Theo Tạp chí Khoa học và Công nghệ Cần Thơ số 08 tháng 11/2025
In bài viết  
Bookmark
Ý kiến của bạn

Phát triển ứng dụng phát hiện hư hỏng đường bộ theo thời gian thực
Hư hỏng mặt đường là một trong những nguyên nhân quan trọng ảnh hưởng trực tiếp đến an toàn giao thông và chi phí bảo trì hạ tầng. Các phương pháp kiểm tra truyền thống chủ yếu dựa trên khảo sát thủ công, không chỉ tốn nhiều thời gian, nhân lực mà còn thiếu tính liên tục và kịp thời. Trước bối cảnh đó, nghiên cứu này đề xuất một ứng dụng Android có khả năng phát hiện hư hỏng đường bộ theo thời gian thực dựa trên các mô hình học sâu phát hiện đối tượng. Trong nghiên cứu, hai mô hình Faster R-CNN và YOLOv12m được huấn luyện và đánh giá trên tập dữ liệu RDD2022 gồm hơn 47.000 ảnh chứa nhiều loại hư hỏng mặt đường. Kết quả thực nghiệm cho thấy Faster R-CNN đạt độ chính xác cao hơn đôi chút (mAP@50 = 66,5%) nhưng có tốc độ suy luận chậm (104 ms/ảnh), trong khi YOLOv12m có độ chính xác xấp xỉ (mAP@50 = 65%) nhưng thời gian xử lý nhanh hơn đáng kể (77 ms/ảnh). Nhờ ưu thế về tốc độ, YOLOv12m được lựa chọn để triển khai trong hệ thống phát hiện thời gian thực. Hệ thống được xây dựng theo mô hình máy chủ – máy khách, trong đó mô hình YOLOv12m được triển khai tại máy chủ và giao tiếp với ứng dụng Android thông qua WebSocket. Kết quả phát hiện được truyền và hiển thị trực tiếp trên giao diện người dùng. Giải pháp đề xuất cho thấy tính khả thi cao trong việc tự động hóa công tác giám sát hạ tầng giao thông, đồng thời tạo tiền đề cho các nghiên cứu và ứng dụng tiếp theo trong lĩnh vực thị giác máy tính và phát hiện hư hỏng đường bộ theo thời gian thực.
Xây dựng mô hình điều khiển thiết bị điện bằng cử chỉ tay ứng dụng Opencv–Python
Sự phát triển nhanh chóng của trí tuệ nhân tạo và công nghệ xử lý ảnh đã mở ra những phương thức tương tác mới giữa con người và thiết bị theo hướng tự nhiên, trực quan và thân thiện hơn. Trong bối cảnh đó, điều khiển thiết bị điện bằng cử chỉ tay đang trở thành một xu hướng nghiên cứu và ứng dụng quan trọng trong lĩnh vực thị giác máy tính và nhà thông minh. Bài viết này trình bày quá trình xây dựng và triển khai một mô hình điều khiển thiết bị điện dựa trên nhận dạng cử chỉ tay, sử dụng thư viện OpenCV-Python kết hợp với Mediapipe và bo mạch vi điều khiển Arduino. Hệ thống khai thác hình ảnh thu được từ camera máy tính để nhận dạng trạng thái gập – duỗi của các ngón tay, mã hóa cử chỉ tay dưới dạng chuỗi nhị phân và chuyển đổi chúng thành các lệnh điều khiển thiết bị điện như đèn LED, động cơ DC và động cơ Servo. Kết quả thực nghiệm cho thấy mô hình có khả năng nhận dạng chính xác các cử chỉ tay cơ bản trong điều kiện ánh sáng phù hợp, với khoảng cách nhận dạng hiệu quả lên đến 100 cm. Nghiên cứu góp phần minh họa tính khả thi của việc ứng dụng công nghệ xử lý ảnh và thị giác máy tính trong giảng dạy, học tập cũng như trong các hệ thống điều khiển thông minh.

Xem nhiều

Tiêu điểm

Chuyển đổi số tại Cần Thơ: Thực trạng và giải pháp hoàn thiện hệ thống chính sách nâng cao năng lực đổi mới sáng tạo của các doanh nghiệp
Nỗ lực hoàn thiện hạ tầng công nghệ thông tin, đảm bảo kết nối thông suốt
Tập trung cao độ cho phát triển kinh tế - xã hội thành phố
Nâng cao chất lượng đội ngũ cán bộ làm công tác đối ngoại
Lãnh đạo UBND thành phố Cần Thơ làm việc với Sở Khoa học và Công nghệ về tình hình hoạt động sau khi hợp nhất ba địa phương
Hội đồng tư vấn, giao trực tiếp tổ chức chủ trì nhiệm vụ KH&CN (Tư vấn và chứng nhận Tiêu chuẩn ISO 9001:2015 – Hệ thống quản lý chất lượng - Các yêu cầu và Tiêu chuẩn ISO 14001:2015 – Hệ thống quản lý môi trường) thuộc Chương trình NSCL năm 2025
Microsoft cáo buộc nhóm tin tặc đứng sau mạng lưới Deepfake AI
Công nghệ lưu trữ lượng tử vừa đạt đột phá: Chứa 5.000 phim 4K trên một tinh thể bé hơn đầu ngón tay?
Sony tuyên bố hợp tác gây chấn động ngành game, mang tính năng độc quyền trên AMD RX 9000 đến PS5 Pro, vạch ra tương lai cho PS6
Startup xe điện Dat Bike đã không còn "trong tay” người Việt
Trung Quốc tự đẩy mình vào 'thời khắc sinh tử': 300 startup xe điện chỉ còn 7 hãng lớn có thể tồn tại, chiến trường xe điện khốc liệt hơn bất kỳ lúc nào
Chuyên gia Phạm Chi Lan chỉ ra 4 điểm yếu của các nhà sáng lập Việt: Nhiều startup cho rằng xuất khẩu được mới 'oai', trong khi thị trường nội còn khó hơn ngoại
Startup KAMEREO ‘ấm bụng’ trong ‘mùa đông gọi vốn’: Hoàn tất vòng Series B với 7,8 triệu USD từ 5 ‘đồng hương’ Nhật Bản
Founder - CEO Amslink: Kiến tạo tương lai Anh ngữ cho thế hệ trẻ Việt
CASTI Awards 2024 - Tôn vinh sản phẩm khoa học, công nghệ và đổi mới sáng tạo
Siêu thị số  
 
Vụ tấn công chuỗi cung ứng Shai-Hulud dẫn đến đánh cắp ví Trust Wallet trị giá 8,5 triệu USD
Loại worm máy tính tự nhân bản Shai-Hulud 2.0 từng xuất hiện trên hệ thống đăng ký NPM vào cuối tháng 11/2025, chính là nguyên nhân gây ra vụ đánh cắp 8,5 triệu USD từ ví tiền điện tử Trust Wallet gần đây.


 
Công nghệ 4.0  
 
Nữ sinh Đại học Kinh tế Quốc dân trúng tuyển thạc sĩ Trí tuệ nhân tạo và Đổi mới sáng tạo liên ngành Đại học Thanh Hoa
Em Lê Thị Mai Trang (sinh năm 2004), sinh viên năm cuối ngành Khoa học Quản lý, Đại học Kinh tế Quốc dân, vừa nhận tin trúng tuyển chương trình thạc sĩ Trí tuệ nhân tạo và Đổi mới sáng tạo liên ngành tại Đại học Thanh Hoa (Trung Quốc). Theo bảng xếp hạng THE 2026, đây là ngôi trường dẫn đầu châu Á, xếp thứ 12 trong số các trường đại học tốt nhất thế giới.


 
Điện tử  
 
Báo cáo ngành robot 2026: Điểm bùng phát mới của công nghệ
Ngành công nghiệp robot bước vào năm 2026 với một bước ngoặt quan trọng. Sau nhiều năm chứng kiến những màn trình diễn gây chú ý, những tuyên bố táo bạo và các thử nghiệm đầy hứa hẹn, câu chuyện giờ đây không còn xoay quanh việc robot có thể làm gì, mà là chúng thực sự làm được gì trong thế giới thực.


 
Tin học  
 
Vụ tấn công chuỗi cung ứng Shai-Hulud dẫn đến đánh cắp ví Trust Wallet trị giá 8,5 triệu USD
Loại worm máy tính tự nhân bản Shai-Hulud 2.0 từng xuất hiện trên hệ thống đăng ký NPM vào cuối tháng 11/2025, chính là nguyên nhân gây ra vụ đánh cắp 8,5 triệu USD từ ví tiền điện tử Trust Wallet gần đây.


 



© Copyright 2020 Trung tâm Khởi nghiệp và Đổi mới sáng tạo - Sở Khoa học và Công nghệ TP. Cần Thơ
Địa chỉ: 118/3 Trần Phú - Phường Cái Khế - thành phố Cần Thơ
Giấy phép số: 05/ GP-TTĐT, do Sở Thông tin và Truyền Thông thành phố Cần Thơ cấp ngày 23/5/2017
Trưởng Ban biên tập: Ông Vũ Minh Hải - Giám Đốc Trung tâm Thông tin Khoa học và Công nghệ - Sở Khoa học & Công nghệ TP. Cần Thơ
Ghi rõ nguồn www.trithuckhoahoc.vn khi bạn sử dụng lại thông tin từ website này
-->