Gemini 3 ra mắt, GPT-5.1 không còn 'một mình một ngựa'

Kiến Văn
Kiến Văn
19/11/2025 08:33 GMT+7

Mô hình AI (trí tuệ nhân tạo) Gemini 3 được mong đợi từ lâu cuối cùng đã chính thức ra mắt sau nhiều lần hé lộ.

Google DeepMind khẳng định rằng Gemini 3 sở hữu khả năng lập luận tiên tiến và đa phương thức vượt trội. Cụ thể, Google cho biết Gemini 3 đã đạt điểm Elo kỷ lục 1.501, đứng đầu Bảng xếp hạng LMArena. Mô hình này cũng ghi nhận thành tích ấn tượng với 37,5% trong bài kiểm tra cuối cùng của Humanity và 91,9% trong GPQA Diamond.

Gemini 3 ra mắt, GPT-5.1 không còn 'một mình một ngựa' - Ảnh 1.

Gemini 3 với nhiều cải tiến ưu việt đã chính thức đến tay người dùng

ẢNH: NEOWIN

Trên MathArena Apex, Gemini 3 đạt điểm số cao nhất là 23,4%. Đặc biệt, mô hình này thể hiện sự vượt trội trong lập luận đa phương thức, với Gemini 3 Pro đạt 81% trong bài kiểm tra MMMU-Pro và 87,6% trong bài kiểm tra Video-MMMU. Trong bài kiểm tra độ chính xác thực tế SimpleQA Verified, Gemini 3 đạt điểm SOTA là 72,1%.

Cùng với Gemini 3 Pro, Google cũng giới thiệu chế độ Gemini 3 Deep Think với hiệu suất vượt trội trong các bài kiểm tra chuẩn AI quan trọng. Cụ thể, Gemini 3 Deep Think đạt 41% trong bài kiểm tra Humanity's Last Exam, 93,8% trong GPQA Diamond và 45,1% trong bài kiểm tra ARC-AGI-2. Đáng chú ý, các mô hình Gemini 3 vẫn hỗ trợ cửa sổ ngữ cảnh lên đến 1 triệu token.

Bước tiến Gemini 3 khiến GPT 5.1 phải dè chừng

Khác với các mẫu Gemini Frontier thường mất nhiều thời gian mới đến tay người dùng, Google hiện áp dụng lịch phát hành nhanh chóng hơn. AI Mode trong Google Tìm kiếm đã bắt đầu sử dụng Gemini 3 để tạo ra những trải nghiệm giao diện người dùng mới, bao gồm bố cục hình ảnh sống động và các công cụ tương tác dựa trên truy vấn của người dùng.

Trong bài kiểm tra chuẩn SWE-bench Verified, Gemini 3 Pro đạt 76,2% trong khả năng lập trình, chỉ thấp hơn một chút so với GPT 5.1 của OpenAI và Sonnet 4.5 của Anthropic. Đối với các nhà phát triển, Gemini 3 hiện đã có mặt trên Google AI Studio, Vertex AI, Gemini CLI, Cursor, GitHub, JetBrains, Manus, Replit và nền tảng phát triển chủ động mới của Google, Google Antigravity.

Người dùng phổ thông có thể trải nghiệm mẫu Gemini 3 qua ứng dụng Gemini, trong khi người dùng Google AI Pro và Ultra có thể truy cập mẫu này tại AI Mode trong Tìm kiếm. Đối với doanh nghiệp, mẫu mới đã có sẵn trong Vertex AI và Gemini Enterprise. Chế độ Gemini 3 Deep Think sẽ được cung cấp cho người dùng Google AI Ultra trong vài tuần tới.

