Cựu nhân viên OpenAI chỉ trích việc thu thập dữ liệu không kiểm soát

Khải Minh
Khải Minh
28/10/2024 10:23 GMT+7

Cách OpenAI thu thập dữ liệu trực tuyến để phát triển sản phẩm AI (trí tuệ nhân tạo) bị cựu nhân viên cáo buộc là đe dọa hệ sinh thái internet và thiếu sự minh bạch về quyền sở hữu trí tuệ.

Theo The New York Times, trong quá trình làm việc tại OpenAI, Suchir Balaji từng chịu trách nhiệm thu thập dữ liệu khổng lồ cho GPT-4, hệ thống AI đa phương thức. Tuy nhiên, theo Balaji, ban đầu anh chỉ xem đây là một dự án nghiên cứu và không ngờ rằng sản phẩm cuối cùng lại là một chatbot tích hợp khả năng tạo hình ảnh AI. "Với dự án nghiên cứu, nhìn chung bạn có thể sử dụng bất kỳ dữ liệu nào để huấn luyện", Balaji nói.

Balaji cho biết ban đầu anh đến với nghiên cứu AI vì tin rằng công nghệ này có thể mang lại lợi ích cho thế giới. Tuy nhiên, hiện nay anh nhận định công nghệ AI của OpenAI gây hại nhiều hơn là đem lại lợi ích cho xã hội. Balaji cho rằng OpenAI đang trở thành mối đe dọa cho chính những cá nhân, doanh nghiệp và dịch vụ internet mà công ty đã thu thập dữ liệu để phát triển sản phẩm của mình. Balaji rời OpenAI sau khi nhận thấy những hành động của công ty không phù hợp với quan điểm đạo đức của mình.

Cựu nhân viên OpenAI chỉ trích việc thu thập dữ liệu không kiểm soát- Ảnh 1.

Phương pháp thu thập dữ liệu của OpenAI có nguy cơ gây ra hệ lụy đối với các nền tảng nội dung

ẢNH: FREEPIK

OpenAI phát triển các sản phẩm như ChatGPTDALL-E bằng cách thu thập dữ liệu từ Internet và đưa vào các chương trình học máy để phân tích và học hỏi. Tuy nhiên, Balaji cảnh báo mô hình này không “bền vững cho hệ sinh thái internet." Đối mặt với chỉ trích, OpenAI đã đưa ra tuyên bố: “Chúng tôi xây dựng các mô hình AI bằng dữ liệu công khai, theo nguyên tắc sử dụng hợp lý (fair use) và các nguyên tắc liên quan, được hỗ trợ bởi các tiền lệ pháp lý lâu đời và được chấp nhận rộng rãi. Chúng tôi xem nguyên tắc này là công bằng với các nhà sáng tạo, cần thiết cho sự đổi mới và quan trọng cho khả năng cạnh tranh của Mỹ”.

Tranh cãi về quyền sở hữu dữ liệu của OpenAI

Vấn đề sử dụng hợp lý để huấn luyện AI vẫn chưa được kiểm chứng tại tòa án và OpenAI hiện đang đối mặt với hàng loạt vụ kiện, chủ yếu từ các nhà xuất bản.

Balaji cho rằng các hoạt động của OpenAI không đáp ứng tiêu chuẩn về sử dụng hợp lý, cáo buộc công ty sao chép và kết hợp dữ liệu có bản quyền một cách không hợp lệ. “Các đầu ra của AI không phải là bản sao chính xác của dữ liệu đầu vào, nhưng cũng không hoàn toàn mới về bản chất”. Để củng cố lập luận của mình, Balaji đã công bố một phân tích toán học trên trang cá nhân, chỉ ra rằng OpenAI vi phạm luật bản quyền.

Với những lời chỉ trích này, Balaji đã thu hút sự chú ý của công chúng đến vấn đề đạo đức trong việc thu thập và sử dụng dữ liệu cho AI. Trong khi đó, các công ty phát triển AI đang phải đối mặt với áp lực ngày càng tăng trong việc bảo vệ quyền sở hữu trí tuệ và giữ vững lòng tin của cộng đồng về tính minh bạch và công bằng trong công nghệ AI.

Top

Bạn không thể gửi bình luận liên tục. Xin hãy đợi
60 giây nữa.