Niantic dùng dữ liệu Pokémon Go để phát triển mô hình AI định vị

Khải Minh
Khải Minh
24/11/2024 14:22 GMT+7

Dựa trên dữ liệu hình ảnh từ Pokémon Go, Niantic đang phát triển hệ thống định vị AI (trí tuệ nhân tạo), mở ra tiềm năng lớn cho công nghệ AR, robot và xe tự hành.

8 năm và 10 triệu hình ảnh đóng góp từ cộng đồng Pokémon Go

Theo một thông tin được công bố bởi Niantic - nhà phát triển tựa game Pokémon Go, thì họ đang phát triển mô hình không gian địa lý lớn (Large Geospatial Model - LGM), ứng dụng dữ liệu hình ảnh và tọa độ địa lý từ các trò chơi di động của mình, đặc biệt là Pokémon Go và ứng dụng Scaniverse.

Khác với các mô hình AI thông thường sử dụng dữ liệu văn bản, âm thanh hay video từ internet, LGM được xây dựng từ hơn 10 triệu hình ảnh địa điểm thực tế do người dùng đóng góp trong 8 năm qua. Trung bình, khoảng 1 triệu bản quét mới được người chơi tải lên hằng tuần. Hầu hết các bản quét này đến từ góc nhìn của người đi bộ, cung cấp dữ liệu quý giá ở những khu vực không thể tiếp cận bằng xe hơi hoặc camera đường phố.

Niantic dùng dữ liệu Pokémon Go để phát triển mô hình AI định vị- Ảnh 1.

Hình ảnh minh họa cách Niantic sử dụng dữ liệu từ các góc nhìn khác nhau để xây dựng mô hình không gian 3D chính xác

ẢNH: NIANTIC


Quá trình phát triển mô hình LGM

Trong suốt 5 năm, Niantic đã tập trung xây dựng hệ thống định vị hình ảnh (Visual Positioning System - VPS). Hệ thống này cho phép xác định vị trí và phương hướng chỉ từ tấm hình duy nhất, dựa trên bản đồ 3D được tạo ra từ dữ liệu hình ảnh của người dùng. Từ đây, LGM được hình thành như một bước tiến xa hơn, xử lý không gian vật lý qua các hình ảnh gắn tọa độ địa lý, tương tự cách các mô hình ngôn ngữ lớn (LLM) xử lý văn bản và ngôn ngữ tự nhiên.

Niantic tiết lộ, họ đã huấn luyện hơn 50 triệu mạng nơ-ron, mỗi mạng đại diện cho một địa điểm hoặc góc nhìn cụ thể. Những mạng nơ-ron này nén hàng nghìn tấm hình thành các biểu diễn số, với tổng cộng 150.000 tỉ tham số. Kết hợp các mạng cục bộ, Niantic kỳ vọng LGM sẽ nhận diện được bất kỳ địa điểm nào trên thế giới, ngay cả khi hình ảnh được chụp từ những góc nhìn chưa từng thấy trước đây.

Niantic mô tả sức mạnh của LGM bằng một ví dụ: “Nếu bạn đang đứng sau một nhà thờ và mô hình chỉ nhận diện được cổng trước, nó sẽ không biết bạn đang ở đâu. Nhưng với LGM, chúng tôi đã có dữ liệu từ hàng nghìn nhà thờ trên toàn thế giới. Dù các nhà thờ không giống hệt nhau, chúng vẫn chia sẻ những đặc điểm kiến trúc tương đồng. LGM sẽ dựa vào kiến thức đó để nhận diện”.

LGM là bước phát triển từ hệ thống định vị Lightship VPS hiện tại, vốn cho phép người chơi đặt vật phẩm ảo trong không gian thực với độ chính xác tính bằng centimet. Tính năng Pokémon Playgrounds trong Pokémon Go đã minh chứng khả năng này, cho phép đặt Pokémon ở các địa điểm thực tế để người khác tìm kiếm.

Ngoài việc hỗ trợ các sản phẩm thực tế tăng cường (AR) và thực tế trộn (MR), Niantic cho biết LGM còn mở ra tiềm năng trong nhiều lĩnh vực khác như robot, tự động hóa, xe tự hành, logistics và lập kế hoạch không gian.

Tuy nhiên, câu hỏi đặt ra là liệu người chơi Pokémon Go có nhận thức đầy đủ về việc dữ liệu họ tạo ra đang được sử dụng để phát triển AI hay không. Mặc dù điều này có thể được đề cập trong các điều khoản dịch vụ của trò chơi, nhưng thông tin chi tiết chỉ mới được công khai gần đây. Vụ việc có thể gây ra các phản ứng trái chiều trong thời gian tới, khi người chơi ngày càng quan tâm đến quyền riêng tư và cách dữ liệu của họ được sử dụng.

Top

Bạn không thể gửi bình luận liên tục. Xin hãy đợi
60 giây nữa.