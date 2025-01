Doctranslate.io là nền tảng dịch thuật bằng AI (trí tuệ nhân tạo), được sáng lập bởi tiến sĩ Trần Vũ Anh. Startup ra đời năm 2023, được Google chọn tham gia chương trình Google Accelerator for Startups 2024. Mới đây, Doctranslate.io tiếp tục nằm trong top 5 startup tiềm năng nhất tại Ngày hội Khởi nghiệp đổi mới sáng tạo Quốc gia (TECHFEST 2024).

AI dịch tối ưu hơn Google, ChatGPT

Sau nhiều năm sinh sống và làm việc ở nước ngoài, Vũ Anh nhận thấy ngôn ngữ là rào cản lớn để mang tri thức đến gần hơn với người Việt. Trong khi các mô hình ngôn ngữ lớn như Google dịch thuật, ChatGPT làm rất tốt công việc phiên dịch trong giao tiếp, hội thoại, Vũ Anh nhận ra còn một "thị trường ngách" nhiều dư địa mà các ông lớn chưa "với tay" đến là dịch thuật văn bản.

"Nếu bạn có một file tài liệu, bài nghiên cứu khoa học dài 20 trang, bạn có thể đưa vào cho ChatGPT dịch. Nhưng chatbot sẽ chỉ trả về các bản dịch dưới dạng chữ viết. Những phần rất quan trọng như biểu đồ, hình ảnh, bảng dữ liệu… gần như bị mất tất cả định dạng. Nếu phải ngồi sắp xếp, thiết kế lại các bảng biểu đó sẽ vô cùng mất thời gian, công sức, thậm chí có thể xảy ra sai sót. Các mô hình ngôn ngữ lớn của Google, OpenAI dù mạnh nhưng vẫn chưa xử lý được triệt để vấn đề. Đó là lý do Doctranslate.io ra đời, tập trung vào việc dịch văn bản, hình ảnh, âm thanh, video", Vũ Anh nói.

File hình ảnh gốc (trái) và file dịch thuật của Doctranslate.io ẢNH: CHỤP MÀN HÌNH

Điểm đặc biệt của nền tảng là người dùng có thể đưa đầu vào là một file văn bản, nhiều định dạng với biểu đồ, hình ảnh. Sau đó AI không chỉ dịch các đoạn văn mà còn dịch cả hình ảnh, giữ nguyên định dạng gốc, giúp người dùng có thể so sánh trực tiếp và dùng ngay, không tốn thêm thời gian để thiết kế lại. Với một file hình ảnh nhiều nội dung, Doctranslate.io thậm chí còn cho phép xuất ra file PowerPoint để người dùng tùy chỉnh từng chi tiết và dùng vào nhiều mục đích khác nhau.

Trong nghiên cứu khoa học được công bố tại hội nghị IEEE-RIVF (International Conference on Computing and Communication Technologies) và IEEE - tổ chức kỹ thuật chuyên nghiệp lớn nhất thế giới), mô hình ALMA-Gemma-7B-IT-ST của Doctranslate.io đã cho điểm vượt trội so với Google Translate, GPT-3.5-Turbo của OpenAI… trong bài kiểm tra dịch thuật từ tiếng Anh sang tiếng Việt.

Cụ thể, trong khi GPT-3.5 Turbo lần lượt được 39,3 điểm và 34,1 điểm cho bài dịch Anh - Việt và ngược lại Việt - Anh, AI của Doctranslate.io vượt trội với 56,21 điểm và 57,32 điểm. Còn Google Translate được 39,86 điểm và 35,76 điểm.



Công thức riêng của startup Việt

Ngoài việc cung cấp những sản phẩm ngách mà các mô hình AI lớn chưa đánh chiếm, một trong những lý do khiến Doctranslate.io vượt trội so với ChatGPT, Google Translate là khả năng hiểu tiếng Việt sâu sắc.

Theo Vũ Anh, tiếng Việt có nhiều đặc trưng so với tiếng Anh và những ngôn ngữ khác. Nếu không nắm rõ, sẽ không thể cải thiện được khả năng dịch thuật của AI. Một trong những ví dụ đơn giản nhất là ngôi thứ. "Chúng ta có rất nhiều danh từ, đại từ nhân xưng để chỉ mối quan hệ và cả sắc thái trong từng ngữ cảnh khác nhau. Ví dụ khi dịch truyện, nói 'ông Chí Phèo' và 'thằng Chí Phèo' là khác nhau rất nhiều. Đây là điều các mô hình AI lớn, nếu không hiểu biết sâu sắc tiếng Việt và không tinh chỉnh sẽ không thể cải thiện được độ chính xác", người sáng lập Doctranslate.io nói.

Giao diện nền tảng dịch thuật Doctranslate.io ẢNH: NGỌC HÂN

Trong quá trình triển khai, đội ngũ của Vũ Anh cũng nhận thấy nhu cầu dịch thuật về tài liệu trong ngành y tế, văn bản của các công ty đa quốc gia, ngân hàng, dịch nội dung các cuộc họp, dịch truyện… là rất lớn. Tuy nhiên không phải lúc nào các tổ chức này cũng sẵn sàng sử dụng các mô hình ngôn ngữ lớn miễn phí như của Google, OpenAI trong hệ thống. Một số định chế cần những mô hình "offline" để có thể dễ dàng tích hợp vào hệ thống, đem lại hiệu quả công việc tốt nhưng đặc biệt hơn là đảm bảo quyền riêng tư của dữ liệu.

Nắm bắt được nhu cầu đó, Doctranslate.io phát triển cả nền tảng dịch thuật cho người dùng phổ thông lẫn phiên bản được tùy chỉnh để có thể dễ dàng tích hợp vào các hệ thống của doanh nghiệp chuyển đổi số cần riêng tư, bảo mật. Hiện tại người dùng có thể sử dụng bản dùng thử miễn phí của Doctranslate.io để dịch văn bản, hình ảnh, video, cuộc hội thoại. Trong khi đó các doanh nghiệp có thể dùng bản cloud hoặc API của Doctranslate.io. Cao hơn, Doctranslate.io còn cung cấp phiên bản on-premises, có độ tùy biến cao và dữ liệu được xử lý ngay tại hệ thống của công ty.

Sau hơn một năm có mặt trên thị trường, Doctranslate.io đang có hơn 200.000 người dùng hoạt động thường xuyên mỗi tháng và được tích hợp trong nhiều hệ thống của doanh nghiệp. Startup AI của Việt Nam dự định sẽ tiếp tục mở rộng thị trường ra các nước trong khu vực Đông Nam Á, sau đó là toàn cầu. "Với Doctranslate.io, chúng tôi từng bước hiện thực hóa mục tiêu đưa tri thức đến gần hơn với mọi người và khẳng định vị thế của trí tuệ Việt trên bản đồ công nghệ toàn cầu", Trần Vũ Anh chia sẻ.