Công nghệ
[ Đăng ngày (29/04/2025) ]
|
Nghiên cứu đề xuất mô hình học sâu ResNet50 để phân loại hình ảnh trong bài báo khoa học, nhằm phát hiện tương đồng và cải thiện tìm kiếm hình ảnh.
|
|
Kết quả nghiên cứu của nhóm tác giả đén từ Trường ĐH Cần Thơ cho thấy: phương pháp đề xuất từ mô hình học sâu ResNet50 đạt độ tin cậy trên 90% trong phát hiện tương đồng hình ảnh, đồng thời xác định được tác giả và năm xuất bản bài báo gốc.
|
Mô hình ResNet50 cũng được so sánh với AlexNet và VGG16, cho thấy khả năng tổng quát hóa vượt trội trong bài toán nhận diện ảnh phức tạp. Nghiên cứu này đặt nền móng cho giải pháp phát hiện tương đồng hình ảnh các ấn phẩm khoa học.
Trong nghiên cứu này, ResNet50 được lựa chọn để phân tích, xử lý và tính toán tương đồng hình ảnh, đồng thời, đặt trong mối tương quan với hai mô hình học sâu phổ biến khác là AlexNet và VGG16 để so sánh hiệu suất phân loại của từng mô hình. Trong đó, ResNet50 chứng minh được khả năng tổng quát hóa tốt nhất, là lựa chọn tối ưu cho các bài toán nhận diện và phân loại ảnh có độ phức tạp cao.
ResNet50 là một phiên bản của kiến trúc ResNet với 50 lớp, bao gồm các lớp tích chập (convolutional layers) kết hợp với các Residual Blocks (khối trong mạng nơ-ron sâu giúp giải quyết các vấn đề khi mạng trở nên quá sâu gây suy giảm đạo hàm và giảm hiệu suất huấn luyện) để cải thiện khả năng học của mô hình, được giới thiệu lần đầu bởi nhóm nghiên cứu của Kaiming He, Xiangyu Zhang, Shaoqing Ren và Jian Sun trong bài báo "Deep Residual Learning for Image Recognition" tại hội nghị CVPR 2015 (He et al., 2016).
Kết luận
Hệ thống cơ sở dữ liệu chứa hình ảnh từ các bài báo khoa học, kết hợp với phương pháp phân loại và trích xuất đặc trưng phục vụ cho tìm kiếm hình ảnh tương đồng với độ chính xác cao được xây dựng trong nghiên cứu. Bằng cách áp dụng mô hình ResNet50, hệ thống có khả năng nhận diện và so sánh hình ảnh một cách hiệu quả, giúp tối ưu hóa quá trình truy xuất thông tin trong lĩnh vực khoa học. Hơn nữa, nghiên cứu đã chứng minh tính hiệu quả của việc sử dụng các thuật toán tối ưu hóa nhằm cải thiện độ chính xác trong phân tích hình ảnh. Hiệu suất của mô hình ResNet50 cũng được đánh giá thông qua việc so sánh với hai mô hình học sâu phổ biến khác là AlexNet và VGG16 trong bài toán phân loại hình ảnh khoa học. Kết quả cho thấy: ResNet50 là mô hình phù hợp nhất để áp dụng vào các bài toán phân loại ảnh có độ phức tạp cao.
Tuy nhiên, để cải thiện hơn nữa hiệu suất, nghiên cứu trong tương lai có thể tập trung vào tối ưu hóa quá trình huấn luyện, áp dụng các phương pháp giảm overfitting và thử nghiệm với nhiều mô hình học sâu tiên tiến hơn
|
htquyen
Theo Tạp chí Khoa học, Đại học Cần Thơ, Tập 61, Số 2A (2025): 44-53 |