Khi ChatGPT không chỉ biết lắng nghe mà còn có thể quan sát
Theo TechRadar, OpenAI đang phát triển tính năng mới mang tên “Live Camera”, được cho là sẽ tích hợp vào chế độ giọng nói nâng cao của ChatGPT. Tính năng này sẽ giúp AI (trí tuệ nhân tạo) không chỉ trò chuyện bằng âm thanh mà còn có khả năng nhận diện và phản hồi về hình ảnh.
“Live Camera” từng được giới thiệu vào tháng 5.2024 khi OpenAI trình diễn cách AI có thể quan sát hình ảnh và đưa ra phản hồi chi tiết. Trong buổi giới thiệu, AI đã nhận diện chính xác một chú chó và cung cấp thông tin về loài, đặc điểm cũng như tên gọi. Tuy nhiên, kể từ đó, OpenAI không công bố thêm bất kỳ thông tin nào về tính năng này.
Mới đây, mã nguồn trong phiên bản beta (v1.2024.317) của ChatGPT hé lộ tham chiếu mang tên “Live Camera”, gợi ý tính năng này có thể sớm ra mắt dưới dạng thử nghiệm beta trước khi được triển khai rộng rãi.
Chế độ giọng nói nâng cao của ChatGPT đã được thử nghiệm ở giai đoạn Alpha, nhận được phản hồi tích cực từ người dùng. Một người thử nghiệm so sánh trải nghiệm với việc gọi FaceTime cùng một “người bạn siêu thông minh”, cho biết tính năng này rất hữu ích khi trả lời câu hỏi theo thời gian thực.
Việc tích hợp khả năng nhận diện hình ảnh và gọi video hứa hẹn giúp ChatGPT vượt xa vai trò của một chatbot thông thường. Đây có thể là công cụ hữu ích cho người khiếm thị, hoặc giúp người dùng xử lý các tình huống yêu cầu nhận diện trực quan.
Hiện tại, OpenAI chưa công bố thời gian ra mắt chính thức hoặc thông tin chi tiết về tính năng “Live Camera”. Tuy nhiên, các dữ liệu mới từ mã nguồn beta cho thấy tính năng này đang được phát triển và có thể sớm đến tay người dùng.
Bình luận (0)