Bên cạnh một hiệu ứng hoạt hình mới trên cả ứng dụng Gemini cho iOS và Android, một người dùng Reddit đã báo cáo về mô hình mới mang tên Gemini Omni. Theo báo cáo, đây có thể là thế hệ công cụ sáng tạo video AI tiếp theo do Google phát triển.
Theo thông tin từ người dùng Zacatac_391, khi mở ứng dụng Gemini, họ nhận được một thông báo mời gọi "tạo nội dung với Gemini Omni" - mô hình tạo video AI mới của Google. Người dùng này đã thử nghiệm với một yêu cầu tạo video, trong đó một giáo sư viết chứng minh toán học cho các hằng đẳng thức lượng giác trên bảng đen.
Video giáo sư viết chứng minh toán học được tạo bởi Gemini Omni
Kết quả là một video ấn tượng đã được tạo ra với những hình ảnh sống động và nội dung chính xác. Mặc dù vậy, video vẫn chưa thực sự hoàn hảo khi một số chi tiết như thao tác viết không khớp với hình ảnh và hiện tượng phấn biến mất ở cuối video cho thấy sự không nhất quán.
Nhiều hạn chế được ghi nhận với Gemini Omni
Zacatac_391 cũng đã thử nghiệm với bài kiểm tra "Will Smith ăn mì Ý" để đánh giá hiệu suất của video AI, nhưng không thu được kết quả như mong đợi.
Theo đó, Zacatac_391 mô tả cảnh hai người đàn ông ngồi tại một nhà hàng sang trọng bên bờ biển. Kết quả video này chưa thực sự ấn tượng khi mì Ý xuất hiện đột ngột trên đĩa và người trong video cũng không nhai kỹ.
Để so sánh, người dùng Reddit janekm3 đã thử nghiệm với mô hình Seedance 2 của ByteDance và nhận thấy chất lượng hình ảnh ổn định hơn so với Omni, mặc dù video vẫn bị giật.
Zacatac_391 cũng phát hiện ra một phần mới hiển thị mức sử dụng cho phép, cho thấy người này đã đạt đến 86% giới hạn sử dụng hằng ngày chỉ sau hai yêu cầu tạo video trên gói Google AI Pro.
Trong khi đó, người dùng Max Weinbach trên X đã tìm thấy siêu dữ liệu chỉ ra rằng Omni là một phần mở rộng của công cụ sáng tạo video AI Veo mà Google phát hành trước đó. Mọi chi tiết về Omni và những cải tiến mà nó mang lại dự kiến sẽ được Google công bố vào tuần sau.
Bình luận (0)