DeepMind muốn dạy AI chơi trò còn khó hơn cả cờ vây

0 Thanh Niên Online
Hanabi là trò chơi bài dựa trên lý thuyết trí tuệ với mức độ lý luận cao hơn cờ vây và cờ vua. Đây là trò mà các nhà nghiên cứu thuộc hãng trí tuệ nhân tạo (AI) DeepMind muốn dạy cho máy móc.
Một ván cờ Hanabi /// Ảnh: Dorkadia Một ván cờ Hanabi - Ảnh: Dorkadia
Một ván cờ Hanabi
Ảnh: Dorkadia
Theo MIT Technology Review, nếu bạn từng chơi bài Hanabi, bạn sẽ hiểu rằng nó không giống như bất cứ trò nào khác. Đây là dạng trò chơi hợp tác, nơi người chơi có cái nhìn đầy đủ về lá bài mà người khác giữ chứ không phải lá bài mà mình nắm.
Để thắng, mỗi người chơi phải đưa ra gợi ý về các lá bài mà mình đang cầm cho người khác theo số vòng giới hạn, nhằm sắp xếp tất cả lá bài theo thứ tự cụ thể. Đây là bài tập cường độ cao về chiến lược, suy luận và sự hợp tác. Đó cũng là lý do vì sao các nhà nghiên cứu thuộc Google Brain và DeepMind cho rằng Hanabi là trò chơi hoàn hảo kế tiếp để AI thử sức.
Trong nghiên cứu mới, họ lập luận rằng không giống các trò chơi khác mà AI từng thành thạo (chẳng hạn như cờ vua, cờ vây và poker), Hanabi đòi hỏi lý thuyết về tâm trí và trình độ lý luận cao. Lý thuyết về tâm trí là việc hiểu trạng thái tinh thần của người khác, hiểu rằng tâm trí, tinh thần họ có thể không giống như của bạn. Đây là kỹ năng nền tảng mà loài người dùng để sống, cũng là kỹ năng mà con người thường lãnh hội được từ lúc còn rất trẻ.
DeepMind muốn dạy AI chơi trò còn khó hơn cả cờ vây - ảnh 2
Alpha Go của Google DeepMind đấu trí trong một ván cờ vây với kỳ thủ Hàn Quốc Lee Sedol
Ảnh: AFP
Thông tin trong Hanabi được giới hạn bởi số lượng gợi ý dành cho người chơi trong mỗi trò chơi và những gì có thể được truyền đạt trong mỗi gợi ý. Vì thế, nhân tố AI phải thu thập thông tin ngầm từ những người chơi khác để thắng trò này. Đây là thách thức mà nó chưa từng đối mặt.
Ngoài ra, thuật toán AI cũng phải học cách cung cấp thông tin sẵn có tối đa trong các gợi ý và hành động của mình để giúp những người chơi khác thành công. Giới nghiên cứu tin rằng nếu một tác nhân AI thành công được trong môi trường thông tin thiếu hoàn hảo như thế, nó sẽ tiến thêm một bước đến việc hợp tác hiệu quả với con người.
Những chi tiết kể trên là thách thức rất mới mẻ với cộng đồng nghiên cứu, đòi hỏi nhiều tiến bộ thuật toán mới để liên kết nhiều mảng nhỏ trong lĩnh vực AI, trong đó có lý thuyết trò chơi, học tập củng cố và giao tiếp rõ ràng. Để xác nhận giả thuyết, nhóm nhà nghiên cứu Google thử nghiệm tất cả các thuật toán học tăng cường hiện đại nhất và nhận ra rằng chúng còn hoạt động kém. Để cải thiện, họ tung môi trường Hanabi nguồn mở để thúc đẩy tác vụ cho cộng đồng nghiên cứu.
“Với tư cách nhà nghiên cứu, tôi bị mê hoặc bởi hướng các yếu tố AI học cách giao tiếp và hợp tác với nhau và cuối cùng là với con người. Hanabi thể hiện cơ hội độc nhất cho thử thách lớn trong mảng này”, Jakob Foerster, đồng tác giả nghiên cứu cho hay.

Bình luận

Gửi bình luận
Ý kiến của bạn sẽ được biên tập trước khi đăng. Xin vui lòng gõ tiếng Việt có dấu
  • Tối thiểu 10 chữ
  • Tiếng Việt có dấu
  • Không chứa liên kết

Có thể bạn quan tâm

VIDEO ĐANG XEM NHIỀU

Đọc thêm

Qualcomm cho rằng hành động của Apple gần đây chứng tỏ iPhone vi phạm bằng sáng chế  /// Ảnh: AFP

Qualcomm tìm cách cấm bán iPhone tại Mỹ

Qualcomm đã có phản ứng liên quan đến việc Apple tung bản cập nhật cho iOS nhằm gỡ bỏ tính năng tiết kiệm năng lượng đã vi phạm bằng sáng chế của công ty mình để tiếp tục bán iPhone tại Mỹ.