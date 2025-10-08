Bạn cần biết Tiện ích Liên hệ
Theo dõi báo trên
Youtube Facebook Tiktok Zalo
Podcast Quảng cáo Đặt báo
Đóng menu
Chào ngày mới Tin 24h Tin thị trường Tin 360
Video Podcast Magazine
Tiện ích Bạn cần biết Liên hệ Thông tin toà soạn Liên hệ quảng cáo
Công nghệ Tin tức công nghệ

Gemini có thể tự lướt web và thao tác như con người

Kiến Văn
Kiến Văn
08/10/2025 16:32 GMT+7

Google vừa giới thiệu mô hình trí tuệ nhân tạo (AI) Gemini mới được thiết kế để điều hướng và tương tác với web thông qua trình duyệt.

Với tên gọi Gemini 2.5 Computer Use, công cụ này cho phép các tác nhân AI thực hiện những tác vụ trong các giao diện được thiết kế cho con người, thay vì cho robot. Mô hình sử dụng "khả năng hiểu và lập luận trực quan" để phân tích yêu cầu của người dùng và thực hiện các tác vụ như điền và gửi biểu mẫu.

Gemini có thể tự lướt web và thao tác như con người - Ảnh 1.

Gemini không chỉ hiểu mà còn hành động trên internet

ẢNH: ZDNET

Gemini 2.5 Computer Use có thể được áp dụng để kiểm tra giao diện người dùng (UI), điều hướng các giao diện không có API hoặc kết nối trực tiếp khác. Trước đó, các phiên bản khác của mô hình này đã được sử dụng cho các tính năng trong Chế độ AI và Dự án Mariner - một nguyên mẫu nghiên cứu cho phép AI tự thực hiện các tác vụ trong trình duyệt, chẳng hạn như thêm hàng vào giỏ dựa trên danh sách nguyên liệu.

Gemini 2.5 Computer Use là câu trả lời đối với ChatGPT Agent

Thông báo của Google được đưa ra chỉ một ngày sau khi OpenAI công bố các ứng dụng mới cho ChatGPT, nhấn mạnh vào tính năng ChatGPT Agent có khả năng hoàn thành các tác vụ phức tạp. Đồng thời, Anthropic cũng đã phát hành phiên bản mô hình AI Claude với "khả năng sử dụng máy tính" vào năm ngoái.

Google đã chia sẻ một số video demo cho thấy cách thức hoạt động của mô hình này, đồng thời cho biết nó nhanh gấp 3 lần so với các lựa chọn khác. Tuy nhiên, khác với ChatGPT Agent và công cụ của Anthropic, mô hình AI mới của Google chỉ có thể truy cập vào trình duyệt, không phải toàn bộ môi trường máy tính.

Chatbot AI Gemini gọi người là 'vết nhơ vũ trụ', tung đe dọa ác ý

Google cũng lưu ý rằng mô hình này "chưa được tối ưu hóa để điều khiển ở cấp độ hệ điều hành máy tính để bàn" và hiện hỗ trợ 13 thao tác, bao gồm mở trình duyệt web, nhập văn bản, cũng như kéo và thả các thành phần.

Gemini 2.5 Computer Use hiện đã có sẵn cho các nhà phát triển thông qua Google AI Studio và Vertex AI, cùng với một bản demo trên Browserbase, nơi người dùng có thể theo dõi quá trình hoàn thành các nhiệm vụ khác nhau.

Tin liên quan

Google thử nghiệm giao diện mới cho Gemini

Google thử nghiệm giao diện mới cho Gemini

Google có kế hoạch cải tiến đáng kể ứng dụng AI Gemini sau khi chứng kiến sự thành công của Sora từ OpenAI.

Khám phá thêm chủ đề

Google chatbot AI trí tuệ nhân tạo tính năng mới OPENAI ChatGPT Agent
Chính trị Thời sự Thế giới Kinh tế
Đời sống Sức khoẻ Giới trẻ Giáo dục
Du lịch Văn hoá Giải trí Thể thao
Công nghệ Xe Thời trang trẻ Video
Podcast Bạn đọc Rao vặt
Đặt báo Quảng cáo RSS Tòa soạn Chính sách bảo mật

Hotline

0906 645 777

Liên hệ quảng cáo

0908 780 404

Tổng biên tập: Nguyễn Ngọc Toàn

Phó tổng biên tập: Hải Thành

Phó tổng biên tập: Lâm Hiếu Dũng

Phó tổng biên tập: Trần Việt Hưng

Tổng thư ký tòa soạn: Đức Trung

Giấy phép xuất bản số 110/GP - BTTTT cấp ngày 24.3.2020 © 2003-2025 Bản quyền thuộc về Báo Thanh Niên. Cấm sao chép dưới mọi hình thức nếu không có sự chấp thuận bằng văn bản. Chứng nhận tín nhiệm mạng
Top

Bạn không thể gửi bình luận liên tục. Xin hãy đợi
60 giây nữa.

Bình luận (0)

Gửi bình luận
Xem thêm bình luận