Trí tuệ nhân tạo [ Đăng ngày (28/02/2026) ]
Một khung dữ liệu sẵn sàng cho AI
Nghiên cứu do nhóm tác giả gồm Neil Majithia, Thomas Carey-Wilson, Elena Simperl (Khoa Tin học, Đại học King's College London, London, Anh) và Nigel Shadbolt (Khoa Khoa học Máy tính, Đại học Oxford, Oxford, Anh) cùng thuộc Viện Dữ liệu Mở, London, Anh thực hiện.

Hình minh họa. Nguồn Internet
Dữ liệu là nền tảng của trí tuệ nhân tạo (AI). Dữ liệu chất lượng kém làm tăng chi phí và có thể dẫn đến các vấn đề tiềm ẩn đối với các mô hình AI, đặc biệt là trong các lĩnh vực phức tạp như chăm sóc sức khỏe và sản xuất. Trong khi đó, dữ liệu thiên vị ảnh hưởng tiêu cực đến hiệu suất của các mô hình AI, và các tập dữ liệu đánh giá chưa được kiểm thử có thể dẫn đến kết quả dương tính giả hoặc đánh giá quá cao độ chính xác của mô hình. Để các nhà xuất bản dữ liệu phát huy hết tiềm năng thực sự của mình trong việc hỗ trợ hệ sinh thái AI và các tác động của nó, họ nên thực hiện các biện pháp để đảm bảo rằng các tập dữ liệu của họ đáp ứng nhu cầu của các nhà thực hành AI; nói cách khác, dữ liệu của họ cần được chuẩn bị sẵn sàng cho AI.


Trong bài viết này, nhóm tác giả đã trình bày một khuôn khổ để các nhà xuất bản dữ liệu tuân theo nhằm chuẩn bị sẵn sàng cho AI các tập dữ liệu của họ. Khuôn khổ này cung cấp hướng dẫn cụ thể, khả thi dựa trên công việc và kinh nghiệm trước đây tại Viện Dữ liệu Mở và được bổ sung bằng những hiểu biết từ tài liệu và các cuộc thảo luận với nhiều chuyên gia. Trước tiên, nhóm tác giả định nghĩa dữ liệu sẵn sàng cho AI trước khi thảo luận ngắn gọn về một số khuôn khổ trong tài liệu và những điểm chưa đầy đủ của chúng. Sau đó, nhóm tác giả cung cấp một hình ảnh trực quan về khuôn khổ của nhóm nghiên cứu cho dữ liệu sẵn sàng cho AI, và tiếp theo là thảo luận chuyên sâu về các tiêu chí của nó. Cuối cùng, nhóm tác giả minh họa việc sử dụng khuôn khổ của mình với một số tập dữ liệu ví dụ. Nhóm nghiên cứu kết luận bằng cách thảo luận về các bước tiếp theo cần thực hiện để toàn bộ hệ sinh thái dữ liệu mở sẵn sàng cho AI, nhằm phát huy hết tiềm năng thực sự của nó trong việc hỗ trợ một tương lai đổi mới.

ctngoc
Theo Tạp chí AI, Tập 47 Số 1 (2026) DOI: 10.1002/aaai.70054
In bài viết  
Bookmark
Ý kiến của bạn

Xem nhiều

Tiêu điểm

Chuyển đổi số tại Cần Thơ: Thực trạng và giải pháp hoàn thiện hệ thống chính sách nâng cao năng lực đổi mới sáng tạo của các doanh nghiệp
86.000 trận động đất bí ẩn được AI tiết lộ ở Yellowstone
Nỗ lực hoàn thiện hạ tầng công nghệ thông tin, đảm bảo kết nối thông suốt
Tập trung cao độ cho phát triển kinh tế - xã hội thành phố
Nâng cao chất lượng đội ngũ cán bộ làm công tác đối ngoại
Lãnh đạo UBND thành phố Cần Thơ làm việc với Sở Khoa học và Công nghệ về tình hình hoạt động sau khi hợp nhất ba địa phương
Hội đồng tư vấn, giao trực tiếp tổ chức chủ trì nhiệm vụ KH&CN (Tư vấn và chứng nhận Tiêu chuẩn ISO 9001:2015 – Hệ thống quản lý chất lượng - Các yêu cầu và Tiêu chuẩn ISO 14001:2015 – Hệ thống quản lý môi trường) thuộc Chương trình NSCL năm 2025
Khám phá ra protein quan trọng đằng sau sức mạnh chống lão hóa của việc tập thể dục
4 triệu chứng chính của ung thư đại tràng
Bộ não bị lão hóa nhanh là do ảnh hưởng từ 64 gene
Ứng dụng di động hỗ trợ phục hồi chức năng liệt nửa người do đột quỵ
Microsoft cáo buộc nhóm tin tặc đứng sau mạng lưới Deepfake AI
Công nghệ lưu trữ lượng tử vừa đạt đột phá: Chứa 5.000 phim 4K trên một tinh thể bé hơn đầu ngón tay?
Sony tuyên bố hợp tác gây chấn động ngành game, mang tính năng độc quyền trên AMD RX 9000 đến PS5 Pro, vạch ra tương lai cho PS6
Đại học Harvard công bố 4 loại trái cây giúp hỗ trợ sống 'trường thọ' nên ăn thường xuyên
Siêu thị số  
 
Thuật toán học tăng cường cải tiến dựa trên xu hướng dữ liệu ứng dụng trong ra quyết định giao dịch thị trường tiền điện tử
Sự phát triển nhanh chóng của thị trường tiền điện tử đặt ra yêu cầu cấp thiết đối với các phương pháp ra quyết định giao dịch có khả năng thích ứng với tính biến động cao và phi tuyến của dữ liệu giá. Trong bối cảnh đó, học tăng cường được xem là một hướng tiếp cận tiềm năng nhờ khả năng học trực tiếp thông qua tương tác với môi trường mà không cần dữ liệu gán nhãn. Tuy nhiên, việc chỉ sử dụng học tăng cường thuần túy thường gặp hạn chế trong việc kiểm soát rủi ro và tối ưu lợi nhuận khi áp dụng vào thị trường tài chính thực tế.


 
Công nghệ 4.0  
 
An toàn dữ liệu tài chính trong kỷ nguyên trí tuệ nhân tạo
Việt Nam hiện là một trong những thị trường tài chính năng động nhất khu vực, nhưng đồng thời cũng là mục tiêu hàng đầu của tội phạm mạng. Khi trí tuệ nhân tạo (AI) thâm nhập sâu vào các dịch vụ ngân hàng, chứng khoán và ví điện tử, khái niệm an toàn dữ liệu tài chính đã thay đổi hoàn toàn về bản chất.


 
Điện tử  
 
AGIBOT triển khai robot bán nhân hình trong sản xuất điện tử
AGIBOT vừa công bố việc đưa dòng robot AGIBOT G2 vào môi trường sản xuất điện tử tiêu dùng tại Longcheer Technology. Đây được xem là bước tiến quan trọng, đánh dấu việc ứng dụng trí tuệ nhân thể (embodied AI) ở quy mô công nghiệp, trực tiếp trong quy trình sản xuất cốt lõi.


 
Tin học  
 
Thuật toán học tăng cường cải tiến dựa trên xu hướng dữ liệu ứng dụng trong ra quyết định giao dịch thị trường tiền điện tử
Sự phát triển nhanh chóng của thị trường tiền điện tử đặt ra yêu cầu cấp thiết đối với các phương pháp ra quyết định giao dịch có khả năng thích ứng với tính biến động cao và phi tuyến của dữ liệu giá. Trong bối cảnh đó, học tăng cường được xem là một hướng tiếp cận tiềm năng nhờ khả năng học trực tiếp thông qua tương tác với môi trường mà không cần dữ liệu gán nhãn. Tuy nhiên, việc chỉ sử dụng học tăng cường thuần túy thường gặp hạn chế trong việc kiểm soát rủi ro và tối ưu lợi nhuận khi áp dụng vào thị trường tài chính thực tế.


 



© Copyright 2020 Trung tâm Khởi nghiệp và Đổi mới sáng tạo - Sở Khoa học và Công nghệ TP. Cần Thơ
Địa chỉ: 118/3 Trần Phú - Phường Cái Khế - thành phố Cần Thơ
Giấy phép số: 05/ GP-TTĐT, do Sở Thông tin và Truyền Thông thành phố Cần Thơ cấp ngày 23/5/2017
Trưởng Ban biên tập: Ông Vũ Minh Hải - Giám đốc Trung tâm Khởi nghiệp và Đổi mới sáng tạo - Sở Khoa học & Công nghệ TP. Cần Thơ
Ghi rõ nguồn www.trithuckhoahoc.vn khi bạn sử dụng lại thông tin từ website này