Theo Bloomberg, trong ví dụ được OpenAI công bố hôm 14.2, phần mềm AI của nhóm được đưa cho văn bản mẫu: “Một toa tàu chứa vật liệu hạt nhân được kiểm soát bị đánh cắp ở Cincinnati hôm nay. Hiện không rõ nó ở đâu”. Từ hai câu này, phần mềm viết thành mẩu tin gồm bảy đoạn đầy thuyết phục, bao gồm cả trích dẫn từ giới chức chính phủ. Dưới đây là mẩu tin mà AI viết.
|
Phần mềm dẫn lời Bộ trưởng Năng lượng Mỹ Tom Hicks để tạo sức thuyết phục. “Vụ đánh cắp vật liệu hạt nhân này để lại nhiều hậu quả tiêu cực lên sức khỏe cộng đồng và môi trường, lực lượng lao động và kinh tế của nước ta. Ưu tiên hàng đầu của chúng tôi là chú ý đến vụ việc và bảo đảm rằng việc này không diễn ra lần nữa”. Thực tế, ông Hicks không hề phát biểu như thế vì thông tin về toa tàu bị đánh cắp không phải sự thật.
Sam Bowman, nhà khoa học máy tính tại Đại học New York, người chuyên xử lý ngôn ngữ tự nhiên và không tham gia vào dự án của OpenAI, cho hay: “Đoạn văn bản mà phần mềm tạo ra khá tuyệt. Nó có thể làm những việc phức tạp hơn về mặt chất lượng so với những điều mà chúng ta từng thấy trước đây”.
OpenAI nhận thức mối lo ngại về tin giả. Jack Clark, giám đốc chính sách OpenAI, cho biết vì lý do an toàn, nhóm không công khai phiên bản tinh vi nhất của phần mềm. Dù vậy, nhóm cũng tạo công cụ cho phép các nhà hoạch định chính sách, nhà báo, nhà văn và nghệ sĩ thử nghiệm thuật toán để xem loại văn bản nào AI có thể tạo ra, và loại nhiệm vụ nào khác nó có thể thực hiện.
Cả ông Clark lẫn Bowman đều nhận định hiện thời, khả năng của hệ thống và phần mềm chưa đủ nhất quán để ngay lập tức gây ra mối đe dọa. “Công nghệ này chưa sẵn sàng làm việc ngay hôm nay, đây là tin tốt”, ông Clark nói.
Mô hình hóa ngôn ngữ
|
Theo nội dung từ bài blog đăng tải hôm 14.2, phần mềm của OpenAI được đào tạo cho nhiệm vụ mô hình hóa ngôn ngữ. Mô hình hóa ngôn ngữ bao gồm việc dự đoán từ tiếp theo trong một đoạn văn bản, dựa trên kiến thức có được từ tất cả các từ ngữ trước đó. Điều này tương tự như cách chức năng tự động hoàn thành từ ngữ chạy trên smartphone. Nó có thể được dùng trong dịch thuật và trả lời các câu hỏi mở.
Một trong các ứng dụng tiềm năng của mô hình hóa ngôn ngữ là giúp nhà văn sáng tạo ý tưởng hoặc đoạn thoại mới, nhà nghiên cứu Jeff Wu thuộc OpenAI chia sẻ. Vài ứng dụng tiềm năng khác là kiểm tra lỗi ngữ pháp trong văn bản, tìm kiếm lỗi trong mã phần mềm và tóm tắt văn bản cho doanh nghiệp hoặc chính phủ.
Năm 2018, giới nghiên cứu đạt nhiều tiến bộ lớn trong việc xử lý ngôn ngữ. Tháng 11.2018, Google tung thuật toán đa tài BERT với khả năng hiểu và trả lời câu hỏi. Viện Trí tuệ Nhân tạo Allen, phòng nghiên cứu tại Seattle, đạt kết quả mang tính bước ngoặt trong mảng xử lý ngôn ngữ với thuật toán Elmo. Ông Bowman cho rằng BERT và Elmo là “sự phát triển có sức ảnh hưởng lớn nhất” trong xử lý ngôn ngữ 5 năm qua. Thuật toán của OpenAI “đáng kể” nhưng không mang tính cách mạng như BERT.
Bình luận (0)