Trí tuệ nhân tạo
[ Đăng ngày (28/02/2026) ]
|
|
Một khung dữ liệu sẵn sàng cho AI
|
|
|
Nghiên cứu do nhóm tác giả gồm Neil Majithia, Thomas Carey-Wilson, Elena Simperl (Khoa Tin học, Đại học King's College London, London, Anh) và Nigel Shadbolt (Khoa Khoa học Máy tính, Đại học Oxford, Oxford, Anh) cùng thuộc Viện Dữ liệu Mở, London, Anh thực hiện.
|
Hình minh họa. Nguồn Internet
Dữ liệu là nền tảng của trí tuệ nhân tạo (AI). Dữ liệu chất lượng kém làm tăng chi phí và có thể dẫn đến các vấn đề tiềm ẩn đối với các mô hình AI, đặc biệt là trong các lĩnh vực phức tạp như chăm sóc sức khỏe và sản xuất. Trong khi đó, dữ liệu thiên vị ảnh hưởng tiêu cực đến hiệu suất của các mô hình AI, và các tập dữ liệu đánh giá chưa được kiểm thử có thể dẫn đến kết quả dương tính giả hoặc đánh giá quá cao độ chính xác của mô hình. Để các nhà xuất bản dữ liệu phát huy hết tiềm năng thực sự của mình trong việc hỗ trợ hệ sinh thái AI và các tác động của nó, họ nên thực hiện các biện pháp để đảm bảo rằng các tập dữ liệu của họ đáp ứng nhu cầu của các nhà thực hành AI; nói cách khác, dữ liệu của họ cần được chuẩn bị sẵn sàng cho AI.
Trong bài viết này, nhóm tác giả đã trình bày một khuôn khổ để các nhà xuất bản dữ liệu tuân theo nhằm chuẩn bị sẵn sàng cho AI các tập dữ liệu của họ. Khuôn khổ này cung cấp hướng dẫn cụ thể, khả thi dựa trên công việc và kinh nghiệm trước đây tại Viện Dữ liệu Mở và được bổ sung bằng những hiểu biết từ tài liệu và các cuộc thảo luận với nhiều chuyên gia. Trước tiên, nhóm tác giả định nghĩa dữ liệu sẵn sàng cho AI trước khi thảo luận ngắn gọn về một số khuôn khổ trong tài liệu và những điểm chưa đầy đủ của chúng. Sau đó, nhóm tác giả cung cấp một hình ảnh trực quan về khuôn khổ của nhóm nghiên cứu cho dữ liệu sẵn sàng cho AI, và tiếp theo là thảo luận chuyên sâu về các tiêu chí của nó. Cuối cùng, nhóm tác giả minh họa việc sử dụng khuôn khổ của mình với một số tập dữ liệu ví dụ. Nhóm nghiên cứu kết luận bằng cách thảo luận về các bước tiếp theo cần thực hiện để toàn bộ hệ sinh thái dữ liệu mở sẵn sàng cho AI, nhằm phát huy hết tiềm năng thực sự của nó trong việc hỗ trợ một tương lai đổi mới. |
ctngoc
Theo Tạp chí AI, Tập 47 Số 1 (2026) DOI: 10.1002/aaai.70054 |