Để giải quyết thách thức này, các nhà nghiên cứu tại Đại học Texas ở Austin đã phát triển phương pháp mà họ tin là phương pháp "loại bỏ khả năng học hỏi của máy" đầu tiên được áp dụng cho AI tạo ra dựa trên hình ảnh. Phương pháp này cung cấp khả năng xem xét kỹ lưỡng và chủ động chặn cũng như xóa mọi hình ảnh bạo lực hoặc tác phẩm có bản quyền mà không làm mất phần thông tin còn lại trong mô hình.
Radu Marculescu, giáo sư tại Khoa Kỹ thuật Điện và Máy tính Chandra Family của Trường Kỹ thuật Cockrell và là một trong những nhà lãnh đạo cho biết: “Khi bạn huấn luyện các mô hình này trên các tập dữ liệu khổng lồ như vậy, bạn nhất định đưa vào một số dữ liệu không mong muốn”.
"Trước đây, cách duy nhất để xóa nội dung có vấn đề là loại bỏ mọi thứ, bắt đầu lại, lấy ra tất cả dữ liệu đó theo cách thủ công và đào tạo lại mô hình. Cách tiếp cận của chúng tôi mang đến cơ hội thực hiện điều này mà không cần phải đào tạo lại mô hình từ đầu."
Các mô hình AI sáng tạo được đào tạo chủ yếu bằng dữ liệu trên internet vì nó chứa đựng lượng thông tin. Nhưng nó cũng chứa một lượng lớn dữ liệu được bảo vệ bản quyền, bên cạnh thông tin cá nhân và nội dung không phù hợp.
Nhấn mạnh vấn đề này, The New York Times gần đây đã kiện OpenAI, nhà sản xuất ChatGPT, cho rằng công ty AI đã sử dụng trái phép các bài viết của mình làm dữ liệu đào tạo để giúp các chatbot của họ tạo ra nội dung.
Guihong Li cho biết: “Nếu chúng tôi muốn làm cho các mô hình AI tổng quát trở nên hữu ích cho mục đích thương mại thì đây là bước chúng tôi cần xây dựng khả năng đảm bảo rằng chúng tôi không vi phạm luật bản quyền hoặc lạm dụng thông tin cá nhân hoặc sử dụng nội dung có hại”. một trợ lý nghiên cứu sau đại học trong phòng thí nghiệm của Marculescu, người đã làm việc trong dự án với tư cách là thực tập sinh tại JPMorgan Chase và hoàn thành nó tại UT.
Các mô hình từ hình ảnh đến hình ảnh là trọng tâm chính của nghiên cứu này. Họ lấy hình ảnh đầu vào và biến đổi nó—chẳng hạn như tạo bản phác thảo, thay đổi một cảnh cụ thể, v.v.—dựa trên bối cảnh hoặc hướng dẫn nhất định.
Thuật toán hủy học máy mới này cung cấp khả năng cho mô hình học máy "quên" hoặc xóa nội dung nếu nó bị gắn cờ vì bất kỳ lý do gì mà không cần phải đào tạo lại mô hình từ đầu. Các nhóm con người xử lý việc kiểm duyệt và xóa nội dung, cung cấp thêm biện pháp kiểm tra về mô hình và khả năng phản hồi phản hồi của người dùng.
Loại bỏ máy là một nhánh đang phát triển của lĩnh vực này chủ yếu được áp dụng cho các mô hình phân loại. Những mô hình đó được đào tạo để sắp xếp dữ liệu thành các danh mục khác nhau, chẳng hạn như hình ảnh hiển thị một con chó hay một con mèo.
Các nhà nghiên cứu viết trong bài báo rằng việc áp dụng việc loại bỏ máy vào các mô hình tổng quát là “tương đối chưa được khám phá”, đặc biệt là khi nói đến hình ảnh. |