Chia sẻ trên blog, Meta, công ty mẹ của Facebook, hi vọng việc phát hành mở mô hình Open Pretrained Transformer (OPT-175B) - mô hình ngôn ngữ có đến 175 tỉ tham số - sẽ giúp ích cho các nhà nghiên cứu hiểu và vận dụng tốt cách hoạt động của các mô hình ngôn ngữ lớn.
Meta mở quyền truy cập mô hình ngôn ngữ lớn, phục vụ cho các nghiên cứu về AI |
shutterstock |
"Mô hình ngôn ngữ lớn" là tập hợp của nhiều hệ thống xử lý ngôn ngữ tự nhiên, được đào tạo trên khối lượng lớn văn bản với khả năng trả lời các câu hỏi hoặc tạo văn bản mới để phản hồi lại (theo cách đọc hiểu chứ không phải chỉ đơn thuần là trả lời theo một số câu lập trình cố định).
Meta cho rằng việc hạn chế quyền truy cập vào các mô hình như vậy đã "cản trở tiến độ trong nỗ lực cải thiện tính mạnh mẽ của chúng...", do đó họ đã phát hành mô hình theo giấy phép phi thương mại để tập trung vào các trường hợp sử dụng có mục đích là nghiên cứu, đồng thời ngăn chặn lạm dụng và "duy trì tính toàn vẹn" cho mô hình này.
Đối tượng được quyền truy cập vào mô hình, theo Meta, sẽ bao gồm các nhà nghiên cứu hàn lâm có liên kết với chính phủ, xã hội dân sự hay các tổ chức học thuật; và các phòng thí nghiệm nghiên cứu trong ngành.
Bên cạnh các mô hình đã được đào tạo trước, Meta sẽ cung cấp mã nguồn để các nhà nghiên cứu, lập trình viên có thể sử dụng chúng dễ dàng hơn.
Bình luận (0)