Trong một bài viết trên blog, Công ty cho biết SeamlessM4T còn có thể phiên dịch toàn bộ "lời nói sang lời nói" với 35 ngôn ngữ.
Giám đốc điều hành Mark Zuckerberg cho biết ông hình dung ra những công cụ như vậy tạo điều kiện thuận lợi cho sự tương tác giữa người dùng trên toàn cầu trong vũ trụ ảo, một tập hợp các thế giới ảo được kết nối với nhau mà ông đang đặt cược tương lai của công ty vào đó.
Bài đăng trên blog cho biết Meta đang xúc tiến cung cấp mô hình này cho công chúng sử dụng với mục đích phi thương mại.
Công ty truyền thông xã hội lớn nhất thế giới đã phát hành một loạt mô hình AI hầu hết miễn phí trong năm nay, bao gồm mô hình ngôn ngữ đàm thoại lớn Llama. Điều này đặt ra thách thức nghiêm trọng đối với các mô hình độc quyền được bán bởi OpenAI do Microsoft hậu thuẫn và Google của Alphabet.
SeamlessM4T được xây dựng dựa trên một dự án trí tuệ nhân tạo (AI) trước đây của Meta. Vào tháng 7.2022, công ty đã triển khai dự án "Không ngôn ngữ nào bị bỏ lại phía sau", sử dụng AI để dịch văn bản thành văn bản cho 200 ngôn ngữ với trọng tâm là cải thiện bản dịch cho các ngôn ngữ hiếm hơn hoặc ít được sử dụng hơn, theo CNET.
Giống như nhiều công ty công nghệ lớn, Meta đã tăng cường tập trung vào việc phát triển và ra mắt các công cụ và dịch vụ hỗ trợ AI trong năm nay. Như Microsoft ra mắt tính năng tìm kiếm Bing mới được tích hợp AI vào tháng 2, sử dụng cùng công nghệ hỗ trợ ChatGPT của OpenAI…
Ông Zuckerberg cho biết hệ sinh thái AI mở mang lại lợi ích cho Meta vì công ty có thể huy động nguồn lực từ cộng đồng một cách hiệu quả để tạo ra các công cụ hướng tới người tiêu dùng, tương tác và phục vụ người tiêu dùng, cho nền tảng xã hội của mình hơn là tính phí truy cập vào các mô hình, theo Reuters.
Tuy nhiên, Meta phải đối mặt với các câu hỏi pháp lý xung quanh vấn đề về dữ liệu đào tạo (dữ liệu ban đầu mà họ cần để tạo ra các mô hình AI).
Vào tháng 7, diễn viên hài Sarah Silverman và hai tác giả khác đã đệ đơn kiện Meta và OpenAI vì vi phạm bản quyền, cáo buộc hai công ty này sử dụng sách của họ làm dữ liệu đào tạo mà không có sự cho phép của tác giả, theo Reuters.
Đối với mô hình SeamlessM4T, các nhà nghiên cứu của Meta cho biết họ đã thu thập dữ liệu đào tạo âm thanh từ 4 triệu giờ "âm thanh thô của kho lưu trữ dữ liệu web có sẵn công khai ". Họ không nói rõ là kho lưu trữ nào. Người phát ngôn của Meta không trả lời các câu hỏi về nguồn gốc của dữ liệu âm thanh. Dữ liệu văn bản đến từ các bộ dữ liệu được tạo ra vào năm ngoái, lấy nội dung từ Wikipedia và các trang web liên kết, theo tài liệu nghiên cứu.
Bình luận (0)