Công nghệ nhận diện giọng nói đang được ứng dụng rộng rãi trên vô số thiết bị công nghệ chúng ta sử dụng hàng ngày. Đỉnh cao trong đó chính là sự ra đời của những trợ lý ảo như Siri (Apple), Alexa (Amazon), Cortana (Microsoft) hay những hệ thống thông tin giải trí trên xe hơi tích hợp ra lệnh bằng giọng nói như SYNC của Ford là một ví dụ.
“Nghe” bằng sóng âm không phải âm thanh
Âm thanh được tạo ra bởi những thay đổi trong áp suất không khí và chúng được tai chúng ta tiếp nhận dưới dạng sóng âm. Khác với con người, máy tính không thực sự “nghe” được âm thanh. Chúng tiếp nhận những câu lệnh của con người bằng cách đo cường độ sóng âm chúng ta tạo ra, lưu trữ và mã hóa chúng để máy tính có thể hiểu được. Những quãng ngắt của sóng âm có thể khiến quá trình đo lường bị rối loạn, gây ảnh hưởng đến tiến trình mã hóa của máy tính. Đây là một quá trình rất phức tạp, nên cũng không có gì khó hiểu nếu đôi lúc các thiết bị thông minh không thể nhận biết chính xác hết câu lệnh.
Xe hơi “nghe” bạn nói bằng sóng âm chứ không phải âm thanh
|
Đỉnh cao hơn của công nghệ này là phải làm sao phân biệt được câu lệnh nào là của lái xe và đâu là của hành khách. Sau khi lưu trữ và mã hóa âm thanh, máy tính sẽ khởi động quá trình nhận diện câu lệnh của người lái. Với việc áp dụng hàng loạt thuật toán phức tạp, hệ thống sẽ tách câu lệnh của người lái khỏi những tạp âm như tiếng động cơ hay tiếng radio, hành khách trong khoang xe.
Phân biệt ngữ điệu của từng vùng
Hệ thống nhận diện giọng nói sẽ phân tích từ ngữ thành từng âm tiết đơn lẻ. Riêng đối với tiếng Anh, chúng ta đã có đến 40 âm tiết khác nhau. Máy tính được lập trình để nhận diện những từ ngữ đã được mã hóa, nhưng đôi khi cách phát âm của người lái khiến quá trình này trở nên khó khăn hơn nhiều. Với một từ ngữ, mỗi người sẽ có một cách phát âm và sử dụng ngữ điệu khác nhau. Dựa trên hệ thống dữ liệu ngôn ngữ được lập trình và tính liên kết của từ ngữ trong câu, máy tính sẽ nhận biết câu lệnh hoàn chỉnh của bạn.
Hiểu ngữ điệu của từng vùng giúp “trợ lý ảo” nhận diện câu lệnh chuẩn hơn
|
Mark Porter - Quản lý mảng Hệ thống Thông tin Giải trí của Ford tại khu vực châu Á - Thái Bình Dương, cho biết: “Với công nghệ nhận diện giọng nói hiện đại, SYNC 3 có thể nhận diện và phản hồi hiệu quả với giọng nói tự nhiên của bạn. Hệ thống đã được điều chỉnh để thích nghi tốt hơn với giọng Anh - Úc, các ngữ điệu khác nhau của tiếng Trung Quốc cũng như nhận biết các kí tự tiếng Trung được viết trên bề mặt cảm ứng hệ thống.
Dự đoán câu lệnh thông minh
Bất kì hệ thống ngôn ngữ nào cũng có những từ ngữ chứa đựng những âm tiết giống nhau, khiến quá trình tiếp nhận và mã hóa của máy tính có thể bị nhầm lẫn. Kết quả là đôi khi máy tính phản hồi không chính xác đối với câu lệnh mà bạn đưa ra. Để khắc phục tình trạng này, hệ thống SYNC 3 sẽ áp dụng nhưng mẫu câu mà chúng ta thường sử dụng trong giao tiếp hàng ngày để dự đoán chính xác từ ngữ được sử dụng trong câu lệnh của người lái xe.
Sau khi áp dụng thuật toán và đưa ra các dự đoán phù hợp, máy tính sẽ chọn lọc và trả lời yêu cầu của người lái xe thông qua màn hình hiển thị hoặc các phản hồi bằng giọng nói. Porter cho biết: “Công nghệ nhận diện giọng nói tiên tiến được tích hợp trên SYNC 3 có thể đưa ra phản hồi gần như ngay lập tức và chính xác hơn rất nhiều. Thay vì phải nói “Radio” rồi chọn thủ công kênh phát thanh yêu thích, giờ đây, bạn có thể sử dụng câu lệnh “Chuyển đài tới tần số …” để lựa chọn bất kì kênh phát thanh nào bạn muốn.
Thật tiện khi chỉ với 1 câu nói tài xế đã có thể bật nhạc hay nghe đài
|
Với việc hoạt động ngày càng chính xác và hiệu quả, Hệ thống điều khiển bằng giọng nói đang đóng vai trò quan trọng trong việc nâng cao chất lượng đời sống của con người. Việc các thiết bị thông minh có thể nhận biết và phản hồi với những gì bạn nói là một bước tiến quan trọng và đáng ghi nhận trong lĩnh vực công nghệ, giúp cuộc sống của chúng ta trở nên dễ dàng và thoải mái hơn. Tuy nhiên, trên hết vẫn là an toàn bởi nếu xe và con người được kết nối, tài xế sẽ không bị phân tầm khi lái xe tránh tình trạng xao nhãng vốn là tối kị khi ngồi sau vô lăng.
Bình luận (0)