Trí tuệ nhân tạo [ Đăng ngày (28/02/2026) ]
Một khung dữ liệu sẵn sàng cho AI
Nghiên cứu do nhóm tác giả gồm Neil Majithia, Thomas Carey-Wilson, Elena Simperl (Khoa Tin học, Đại học King's College London, London, Anh) và Nigel Shadbolt (Khoa Khoa học Máy tính, Đại học Oxford, Oxford, Anh) cùng thuộc Viện Dữ liệu Mở, London, Anh thực hiện.

Hình minh họa. Nguồn Internet
Dữ liệu là nền tảng của trí tuệ nhân tạo (AI). Dữ liệu chất lượng kém làm tăng chi phí và có thể dẫn đến các vấn đề tiềm ẩn đối với các mô hình AI, đặc biệt là trong các lĩnh vực phức tạp như chăm sóc sức khỏe và sản xuất. Trong khi đó, dữ liệu thiên vị ảnh hưởng tiêu cực đến hiệu suất của các mô hình AI, và các tập dữ liệu đánh giá chưa được kiểm thử có thể dẫn đến kết quả dương tính giả hoặc đánh giá quá cao độ chính xác của mô hình. Để các nhà xuất bản dữ liệu phát huy hết tiềm năng thực sự của mình trong việc hỗ trợ hệ sinh thái AI và các tác động của nó, họ nên thực hiện các biện pháp để đảm bảo rằng các tập dữ liệu của họ đáp ứng nhu cầu của các nhà thực hành AI; nói cách khác, dữ liệu của họ cần được chuẩn bị sẵn sàng cho AI.


Trong bài viết này, nhóm tác giả đã trình bày một khuôn khổ để các nhà xuất bản dữ liệu tuân theo nhằm chuẩn bị sẵn sàng cho AI các tập dữ liệu của họ. Khuôn khổ này cung cấp hướng dẫn cụ thể, khả thi dựa trên công việc và kinh nghiệm trước đây tại Viện Dữ liệu Mở và được bổ sung bằng những hiểu biết từ tài liệu và các cuộc thảo luận với nhiều chuyên gia. Trước tiên, nhóm tác giả định nghĩa dữ liệu sẵn sàng cho AI trước khi thảo luận ngắn gọn về một số khuôn khổ trong tài liệu và những điểm chưa đầy đủ của chúng. Sau đó, nhóm tác giả cung cấp một hình ảnh trực quan về khuôn khổ của nhóm nghiên cứu cho dữ liệu sẵn sàng cho AI, và tiếp theo là thảo luận chuyên sâu về các tiêu chí của nó. Cuối cùng, nhóm tác giả minh họa việc sử dụng khuôn khổ của mình với một số tập dữ liệu ví dụ. Nhóm nghiên cứu kết luận bằng cách thảo luận về các bước tiếp theo cần thực hiện để toàn bộ hệ sinh thái dữ liệu mở sẵn sàng cho AI, nhằm phát huy hết tiềm năng thực sự của nó trong việc hỗ trợ một tương lai đổi mới.

ctngoc
Theo Tạp chí AI, Tập 47 Số 1 (2026) DOI: 10.1002/aaai.70054
In bài viết  
Bookmark
Ý kiến của bạn

Xem nhiều

Tiêu điểm

Chuyển đổi số tại Cần Thơ: Thực trạng và giải pháp hoàn thiện hệ thống chính sách nâng cao năng lực đổi mới sáng tạo của các doanh nghiệp
Nỗ lực hoàn thiện hạ tầng công nghệ thông tin, đảm bảo kết nối thông suốt
Tập trung cao độ cho phát triển kinh tế - xã hội thành phố
Nâng cao chất lượng đội ngũ cán bộ làm công tác đối ngoại
Lãnh đạo UBND thành phố Cần Thơ làm việc với Sở Khoa học và Công nghệ về tình hình hoạt động sau khi hợp nhất ba địa phương
Hội đồng tư vấn, giao trực tiếp tổ chức chủ trì nhiệm vụ KH&CN (Tư vấn và chứng nhận Tiêu chuẩn ISO 9001:2015 – Hệ thống quản lý chất lượng - Các yêu cầu và Tiêu chuẩn ISO 14001:2015 – Hệ thống quản lý môi trường) thuộc Chương trình NSCL năm 2025
Microsoft cáo buộc nhóm tin tặc đứng sau mạng lưới Deepfake AI
Công nghệ lưu trữ lượng tử vừa đạt đột phá: Chứa 5.000 phim 4K trên một tinh thể bé hơn đầu ngón tay?
Sony tuyên bố hợp tác gây chấn động ngành game, mang tính năng độc quyền trên AMD RX 9000 đến PS5 Pro, vạch ra tương lai cho PS6
Startup xe điện Dat Bike đã không còn "trong tay” người Việt
Trung Quốc tự đẩy mình vào 'thời khắc sinh tử': 300 startup xe điện chỉ còn 7 hãng lớn có thể tồn tại, chiến trường xe điện khốc liệt hơn bất kỳ lúc nào
Chuyên gia Phạm Chi Lan chỉ ra 4 điểm yếu của các nhà sáng lập Việt: Nhiều startup cho rằng xuất khẩu được mới 'oai', trong khi thị trường nội còn khó hơn ngoại
Startup KAMEREO ‘ấm bụng’ trong ‘mùa đông gọi vốn’: Hoàn tất vòng Series B với 7,8 triệu USD từ 5 ‘đồng hương’ Nhật Bản
Founder - CEO Amslink: Kiến tạo tương lai Anh ngữ cho thế hệ trẻ Việt
CASTI Awards 2024 - Tôn vinh sản phẩm khoa học, công nghệ và đổi mới sáng tạo
Siêu thị số  
 
Windows PowerShell hiện thông tin cảnh báo khi chạy tập lệnh Invoke-WebRequest
Microsoft xác nhận Windows PowerShell hiện đưa ra cảnh báo khi chạy các tập lệnh sử dụng cmdlet Invoke-WebRequest để tải xuống nội dung web, nhằm ngăn chặn việc thực thi mã có khả năng gây rủi ro. Theo giải thích của Microsoft, điều này sẽ giảm thiểu lỗ hổng thực thi mã từ xa PowerShell có mức độ nghiêm trọng cao (CVE-2025-54100), chủ yếu ảnh hưởng đến môi trường do doanh nghiệp hoặc tổ chức sử dụng tập lệnh Powershell để tự động hóa, vì tập lệnh PowerShell không được sử dụng phổ biến bên ngoài các môi trường như vậy.


 
Điện tử  
 
Microsoft ra mắt chip AI thế hệ mới nhằm giảm phụ thuộc vào Nvidia
Microsoft vừa công bố chip trí tuệ nhân tạo thế hệ thứ hai mang tên Maia 200, đánh dấu bước tiến quan trọng trong nỗ lực tự chủ phần cứng và giảm sự phụ thuộc vào Nvidia – nhà cung cấp GPU hàng đầu hiện nay.


 
Tin học  
 
Windows PowerShell hiện thông tin cảnh báo khi chạy tập lệnh Invoke-WebRequest
Microsoft xác nhận Windows PowerShell hiện đưa ra cảnh báo khi chạy các tập lệnh sử dụng cmdlet Invoke-WebRequest để tải xuống nội dung web, nhằm ngăn chặn việc thực thi mã có khả năng gây rủi ro. Theo giải thích của Microsoft, điều này sẽ giảm thiểu lỗ hổng thực thi mã từ xa PowerShell có mức độ nghiêm trọng cao (CVE-2025-54100), chủ yếu ảnh hưởng đến môi trường do doanh nghiệp hoặc tổ chức sử dụng tập lệnh Powershell để tự động hóa, vì tập lệnh PowerShell không được sử dụng phổ biến bên ngoài các môi trường như vậy.


 



© Copyright 2020 Trung tâm Khởi nghiệp và Đổi mới sáng tạo - Sở Khoa học và Công nghệ TP. Cần Thơ
Địa chỉ: 118/3 Trần Phú - Phường Cái Khế - thành phố Cần Thơ
Giấy phép số: 05/ GP-TTĐT, do Sở Thông tin và Truyền Thông thành phố Cần Thơ cấp ngày 23/5/2017
Trưởng Ban biên tập: Ông Vũ Minh Hải - Giám Đốc Trung tâm Thông tin Khoa học và Công nghệ - Sở Khoa học & Công nghệ TP. Cần Thơ
Ghi rõ nguồn www.trithuckhoahoc.vn khi bạn sử dụng lại thông tin từ website này
-->