Theo Neowin, Microsoft Cognitive Services là một bộ các API, SDK và các dịch vụ do Microsoft cung cấp đến các nhà phát triển để họ tận dụng làm cho ứng dụng của mình thông minh hơn, hấp dẫn và trực quan hơn. Các API máy học này cho phép các nhà phát triển thêm nhiều tính năng thông minh khác nhau vào ứng dụng của họ như phát hiện cảm xúc, nhận diện khuôn mặt, giọng nói và tầm nhìn, hiểu và dịch ngôn ngữ.
Một trong những điều này bao gồm Bing Speech API, cho phép các nhà phát triển tích hợp và sử dụng các tính năng hỗ trợ phát âm trong các ứng dụng của họ. Nó gồm hai khả năng Speech-to-Text giúp chuyển đổi từ tiếng nói của người sang văn bản như là một lệnh hoặc đầu vào, và Text-to-Speech giúp chuyển văn bản thành âm thanh có thể được sử dụng ở dạng đầu ra.
Với bản cập nhật mới Bing Speech API sẽ bổ sung 6 ngôn ngữ mới cho Text-to-Speech, nâng tổng số ngôn ngữ hỗ trợ lên đến 34. Chúng gồm tiếng Bungari, Croatia, Malaysia, Slovenia, Tamil và Việt Nam.
Qinying Liao, quản lý chương trình cao cấp cho AI Core-Speech của Microsoft, tuyên bố API Text-to-Speech có thể được sử dụng riêng hoặc kết hợp với các dịch vụ nhận thức khác, chẳng hạn như API nhận biết tiếng nói và ngôn ngữ để tạo ra giải pháp trực tuyến dựa trên giọng nói hoặc trên thiết bị.
Ngoài ra các ngôn ngữ Text-to-Speech mới sẽ có sẵn thông qua API của Microsoft Translator Speech và ứng dụng Microsoft Translator vào cuối tháng 2.2018, cho phép các nhà phát triển tích hợp vào các ứng dụng của họ sử dụng các API của Translator.
Bình luận (0)