Một sự cố đáng báo động vừa được phát hiện, cho thấy các đoạn hội thoại riêng tư của người dùng ChatGPT, có cả các vấn đề cá nhân và công việc, đã bị rò rỉ. Đáng nói hơn, chúng xuất hiện trong báo cáo lưu lượng truy cập của Google Search Console, khiến các chủ trang web hoàn toàn xa lạ có thể đọc được.

ChatGPT gặp lỗi khiến các đoạn chat cá nhân của người dùng bị rò rỉ

Theo TechSpot, sự bất thường này bắt đầu từ tháng 9, khi các nhà phát triển sử dụng Google Search Console (GSC) bỗng phát hiện các chuỗi văn bản lạ trong báo cáo của họ. Thay vì các cụm từ tìm kiếm ngắn gọn thông thường, báo cáo của họ chứa toàn bộ các câu lệnh (prompt), giống hệt những cuộc hội thoại riêng tư với chatbot.

Điều này đã khiến các quản trị viên trang web sửng sốt, khi hệ thống phân tích lưu lượng truy cập của họ bỗng nhiên ghi lại các cuộc trò chuyện riêng tư.

Các đoạn prompt của ChatGPT bị lộ trên Google Search ẢNH: CHỤP MÀN HÌNH TECHSPOT

Sự việc được báo cáo lần đầu tiên bởi Jason Packer, người sáng lập công ty phân tích Quantable. Sau nhiều tuần điều tra cùng nhà tư vấn Slobodan Manić, họ đã tìm ra nguyên nhân, đặt ra những câu hỏi lớn về quyền riêng tư.

Theo điều tra, một số phiên làm việc của ChatGPT đã vô tình định tuyến câu lệnh của người dùng đến Google Search. Lỗi này dường như bắt nguồn từ một mẫu URL cụ thể là openai.com/index/chatgpt liên tục xuất hiện ở đầu các truy vấn bị rò rỉ.

Khi Google phân tích địa chỉ này, nó vô tình tách thành các từ khóa tìm kiếm ("openai", "index", "chatgpt"). Các trang web có thứ hạng cao cho những từ khóa này đã thấy dữ liệu (gồm cả đoạn chat riêng tư) xuất hiện trong bảng điều khiển GSC của họ.

Nói một cách đơn giản, một lỗi trong ChatGPT đã đính kèm cả URL giới thiệu lẫn toàn bộ câu lệnh của người dùng vào truy vấn tìm kiếm. Google đã ghi lại toàn bộ chuỗi này và bất kỳ ai quản lý trang web có xếp hạng cho các từ khóa đó đều có thể thấy các câu lệnh bị rò rỉ.

Vấn đề được cho là liên quan đến hành vi 'duyệt web' được giới thiệu trên các mô hình GPT-5 mới hơn. Các nhà nghiên cứu phát hiện ra tham số "hints=search" đã khiến chatbot thực hiện tìm kiếm gần như mọi lúc, làm tăng nguy cơ rò rỉ.

Phát hiện này cũng ngụ ý rằng ChatGPT đang tương tác trực tiếp với cơ sở hạ tầng indexing của Google (giống như 'cào' dữ liệu) chứ không phải qua một API riêng tư. "Nếu đó là API hoặc kênh dữ liệu riêng tư, nó sẽ không xuất hiện bên trong Search Console", Packer viết.

Hàng ngàn đoạn chat riêng tư với ChatGPT bị lộ trên Google

OpenAI đã thừa nhận vấn đề, mô tả đây là một "lỗi định tuyến" ảnh hưởng đến "một nhóm nhỏ" các tìm kiếm và khẳng định đã khắc phục.

Tuy nhiên, Packer nhấn mạnh rằng sự cố này hoàn toàn khác với các vụ rò rỉ trước đây (vốn yêu cầu người dùng vô tình nhấp vào nút Share). Lần này, lỗi xảy ra tự động. "Không có cơ chế đồng ý nào cả", ông nói. "Không ai nhấp vào nút Share. Các câu lệnh này chỉ bị định tuyến sai".

OpenAI không cung cấp con số cụ thể về số lượng người dùng bị ảnh hưởng trong số khoảng 700 triệu người dùng hằng tuần của họ. Vụ việc một lần nữa cho thấy các hệ thống AI phức tạp vẫn đang xử lý dữ liệu người dùng theo những cách không thể đoán trước.