DeepMind muốn dạy AI chơi trò còn khó hơn cả cờ vây

Thu Thảo - nguyen.thuthao1188@gmail.com

10/02/2019 16:26 GMT+7

Hanabi là trò chơi bài dựa trên lý thuyết trí tuệ với mức độ lý luận cao hơn cờ vây và cờ vua. Đây là trò mà các nhà nghiên cứu thuộc hãng trí tuệ nhân tạo (AI) DeepMind muốn dạy cho máy móc.

Theo MIT Technology Review, nếu bạn từng chơi bài Hanabi, bạn sẽ hiểu rằng nó không giống như bất cứ trò nào khác. Đây là dạng trò chơi hợp tác, nơi người chơi có cái nhìn đầy đủ về lá bài mà người khác giữ chứ không phải lá bài mà mình nắm.

tin liên quan

AI của Google cho game thủ StarCraft chuyên nghiệp ăn 'hành'

Để thắng, mỗi người chơi phải đưa ra gợi ý về các lá bài mà mình đang cầm cho người khác theo số vòng giới hạn, nhằm sắp xếp tất cả lá bài theo thứ tự cụ thể. Đây là bài tập cường độ cao về chiến lược, suy luận và sự hợp tác. Đó cũng là lý do vì sao các nhà nghiên cứu thuộc Google Brain và DeepMind cho rằng Hanabi là trò chơi hoàn hảo kế tiếp để AI thử sức.

Trong nghiên cứu mới, họ lập luận rằng không giống các trò chơi khác mà AI từng thành thạo (chẳng hạn như cờ vua, cờ vây và poker), Hanabi đòi hỏi lý thuyết về tâm trí và trình độ lý luận cao. Lý thuyết về tâm trí là việc hiểu trạng thái tinh thần của người khác, hiểu rằng tâm trí, tinh thần họ có thể không giống như của bạn. Đây là kỹ năng nền tảng mà loài người dùng để sống, cũng là kỹ năng mà con người thường lãnh hội được từ lúc còn rất trẻ.

Alpha Go của Google DeepMind đấu trí trong một ván cờ vây với kỳ thủ Hàn Quốc Lee Sedol Ảnh: AFP

Thông tin trong Hanabi được giới hạn bởi số lượng gợi ý dành cho người chơi trong mỗi trò chơi và những gì có thể được truyền đạt trong mỗi gợi ý. Vì thế, nhân tố AI phải thu thập thông tin ngầm từ những người chơi khác để thắng trò này. Đây là thách thức mà nó chưa từng đối mặt.

Ngoài ra, thuật toán AI cũng phải học cách cung cấp thông tin sẵn có tối đa trong các gợi ý và hành động của mình để giúp những người chơi khác thành công. Giới nghiên cứu tin rằng nếu một tác nhân AI thành công được trong môi trường thông tin thiếu hoàn hảo như thế, nó sẽ tiến thêm một bước đến việc hợp tác hiệu quả với con người.

Những chi tiết kể trên là thách thức rất mới mẻ với cộng đồng nghiên cứu, đòi hỏi nhiều tiến bộ thuật toán mới để liên kết nhiều mảng nhỏ trong lĩnh vực AI, trong đó có lý thuyết trò chơi, học tập củng cố và giao tiếp rõ ràng. Để xác nhận giả thuyết, nhóm nhà nghiên cứu Google thử nghiệm tất cả các thuật toán học tăng cường hiện đại nhất và nhận ra rằng chúng còn hoạt động kém. Để cải thiện, họ tung môi trường Hanabi nguồn mở để thúc đẩy tác vụ cho cộng đồng nghiên cứu.

“Với tư cách nhà nghiên cứu, tôi bị mê hoặc bởi hướng các yếu tố AI học cách giao tiếp và hợp tác với nhau và cuối cùng là với con người. Hanabi thể hiện cơ hội độc nhất cho thử thách lớn trong mảng này”, Jakob Foerster, đồng tác giả nghiên cứu cho hay.

Bình luận (0)

Gửi bình luận

Xem thêm bình luận

Khám phá thêm chủ đề

trí tuệ nhân tạo Cờ vua AI Google Brain Hanabi Alpha Go DeepMind Chơi bài Cờ vây Thuật toán

DeepMind muốn dạy AI chơi trò còn khó hơn cả cờ vây

Hanabi là trò chơi bài dựa trên lý thuyết trí tuệ với mức độ lý luận cao hơn cờ vây và cờ vua. Đây là trò mà các nhà nghiên cứu thuộc hãng trí tuệ nhân tạo (AI) DeepMind muốn dạy cho máy móc.

Tin liên quan

Thuật toán AI DeepMind của Alphabet thắng giải dự đoán gập xoắn protein

Gần 1.000 chuyên gia dự báo gì về trí tuệ nhân tạo năm 2030?

Những lời khuyên dành cho bạn trẻ đam mê AI

Khám phá thêm chủ đề

Bạn không thể gửi bình luận liên tục. Xin hãy đợi 60 giây nữa.

Bạn không thể gửi bình luận liên tục. Xin hãy đợi
60 giây nữa.