Google đáp trả nhanh ChatGPT Translate bằng TranslateGemma

16/01/2026 09:39 GMT+7

Google vừa công bố bộ mô hình dịch thuật mở mới mang tên TranslateGemma, được phát triển dựa trên mô hình Gemma 3 nguồn mở.

Google cho biết đây là "một bước tiến đáng kể trong lĩnh vực dịch thuật mở". Bộ mô hình này có khả năng xử lý tới 55 ngôn ngữ, bao gồm các ngôn ngữ phổ biến như tiếng Tây Ban Nha, Pháp, Trung Quốc và Hindi.

Google đáp trả nhanh ChatGPT Translate bằng TranslateGemma - Ảnh 1.

Bộ mô hình TranslateGemma cho thấy hướng đi mới của Google trong dịch thuật AI

ẢNH: GOOGLE

Thông báo về TranslateGemma được đưa ra chỉ vài giờ sau khi OpenAI phát hành ChatGPT Translate - một công cụ tập trung vào việc dịch thuật với giọng điệu và ngữ cảnh chính xác, thay vì chỉ dịch từng từ. ChatGPT Translate có giao diện hai bảng, với tính năng tự động nhận diện ngôn ngữ ở bên trái và ngôn ngữ đích ở bên phải, tương tự như Google Translate.

Google mang dịch thuật mở lên tầm mới

TranslateGemma có sẵn với các mô hình 4B, 12B và 27B. Theo Google, mô hình 12B cho hiệu suất tốt hơn so với mô hình Gemma 3 27B cơ bản khi đo trên chuẩn WMT24++, có nghĩa các nhà phát triển có thể đạt được hiệu suất cao hơn với tham số ít hơn một nửa, giúp tăng thông lượng và giảm độ trễ mà không làm giảm độ chính xác.

Mô hình 4B được tối ưu hóa cho suy luận trên thiết bị di động, trong khi mô hình 12B phù hợp với máy tính xách tay của người tiêu dùng. Mô hình 27B lớn hơn yêu cầu sức mạnh tính toán cao hơn, chẳng hạn như một card đồ họa NVIDIA H100 trên đám mây. Các thử nghiệm trên chuẩn dịch hình ảnh Vistra cho thấy TranslateGemma có khả năng dịch văn bản trong hình ảnh tốt hơn, mặc dù không được tinh chỉnh đặc biệt cho mục đích này.

Google cho biết họ đã đạt được hiệu suất nói trên thông qua một quy trình hai giai đoạn. Giai đoạn đầu tiên là Tinh chỉnh có giám sát (Supervised Fine-Tuning), trong đó các mô hình Gemma 3 được huấn luyện trên sự kết hợp giữa văn bản do con người dịch và dữ liệu tổng hợp chất lượng cao. Giai đoạn thứ hai là Học tăng cường (Reinforcement Learning), sử dụng một nhóm các mô hình khen thưởng để hướng dẫn các mô hình đến các bản dịch tự nhiên và chính xác hơn về ngữ cảnh.

Các mô hình TranslateGemma hiện đã có sẵn để tải xuống trên Kaggle và Hugging Face, từ đó mở ra cơ hội cho bất kỳ ai muốn thử nghiệm hoặc phát triển dựa trên chúng.

Top

Bạn không thể gửi bình luận liên tục. Xin hãy đợi
60 giây nữa.