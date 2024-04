Niềm tự hào Tiếng Việt

Ngày 18.1, Samsung mở ra kỷ nguyên mới trên thiết bị di động khi trang bị loạt tính năng từ Galaxy AI lên dòng sản phẩm Galaxy S24. Tràng pháo tay kéo dài không ngớt trong khán phòng Unpacked 2024 khi ông Drew Blackard - Trưởng Bộ phận Quản lý sản phẩm, Samsung Electronics America - trình diễn về tính năng dịch trực tiếp trên thiết bị. Cách đó nửa vòng trái đất, tại Hà Nội, Trần Tuấn Minh - Trưởng nhóm nghiên cứu ngôn ngữ AI cùng đội ngũ kỹ sư tại Trung tâm Nghiên cứu và Phát triển Samsung Việt Nam (SRV) cũng hồi hộp theo dõi từng diễn biến của sự kiện. Đình Thắng cùng cộng sự đang hồi hộp mong chờ một cột mốc đầy tự hào sắp được công bố.

"Mọi người như vỡ òa khi Drew Blackard giới thiệu các ngôn ngữ đầu tiên được hỗ trợ tính năng dịch bằng GenAI trên Galaxy S24. Vietnamese - Tiếng Việt - xuất hiện trên sân khấu cùng 12 ngôn ngữ đầu tiên được hỗ trợ tính năng này. Bầu không khí tự hào bao trùm cả trung tâm", Tuấn Minh kể.

Ông Drew Blackard công bố những ngôn ngữ đầu tiên trên thế giới được hỗ trợ bởi Galaxy AI tại sự kiện Unpacked 2024, trong đó có Vietnamese - tiếng Việt

Theo kỹ sư R&D của Samsung, đây không chỉ là niềm tự hào cá nhân khi những đóng góp của người Việt được ghi nhận mà còn là lòng tự tôn dân tộc khi tiếng Việt trở thành nhóm ngôn ngữ chính được ưu tiên phát triển trên một sản phẩm đầu bảng của Samsung. "Điều đó đồng nghĩa người dùng Việt Nam sẽ là những khách hàng đầu tiên được trải nghiệm những công nghệ mới nhất, bằng chính ngôn ngữ mẹ đẻ và sẽ được hỗ trợ rất nhiều từ tác vụ trong đời sống hàng ngày đến công việc", Tuấn Minh nói.

Bốn tháng chạy đua

Theo anh Trần Tuấn Minh, trước đây khi một tính năng mới được phát triển ở các trung tâm nghiên cứu, tiếng Việt thường không được ưu tiên phát triển trước. Nhưng từ khi Trung tâm R&D Hà Nội đi vào hoạt động, vai trò của kỹ sư Việt đã thay đổi rất nhiều. Dự án đưa tiếng Việt lên các tính năng GenAI ngay trong lần đầu ra mắt vừa là niềm tự hào nhưng cũng là thử thách của đội ngũ kỹ sư Việt Nam. Thông thường, các kỹ sư cần ít nhất 6 tháng đến 1 năm để phát triển AI ngôn ngữ lớn, nhưng nhóm kỹ sư SRV đã thực hiện điều này chỉ trong 4 tháng trước Galaxy Unpacked 2024.

"Đó là thách thức vô cùng lớn, trong 4 tháng, chúng tôi liên tục bay qua lại giữa Việt Nam với các trung tâm R&D của Hàn Quốc, Ấn Độ để làm việc với các kỹ sư nhằm xây dựng bộ dữ liệu Tiếng Việt kèm văn bản tương ứng để ‘dạy AI’ nói, hiểu tiếng Việt", Tuấn Minh chia sẻ.

Kỹ sư Trần Tuấn Minh cùng nhóm kỹ sư thực hiện dự án AI

Những người làm AI đều hiểu, thách thức lớn nhất của các kỹ sư là dữ liệu để dạy AI bằng tiếng Việt rất hạn chế so với tiếng Anh hay các ngôn ngữ phổ biến khác. Chất lượng đầu vào cũng rất hạn chế do AI vẫn là lĩnh vực mới ở Việt Nam. Việc ít dữ liệu thô và chất lượng thấp sẽ ảnh hưởng trực tiếp đến độ chính xác của đầu ra AI. Do đó, trước khi bắt đầu "dạy AI nói tiếng Việt", Tuấn Minh và các cộng sự đã ngồi lại phân tích các dữ liệu hiện có, xác định đâu là "vùng lõm" để cải thiện. Ví dụ những câu dịch tiếng Anh chất lượng thấp sẽ được xử lý lại để đảm bảo chất lượng tốt nhất.

Giải quyết xong phần đầu vào cho module dịch, chúng tôi tiếp tục phát hiện ra một thách thức khác của Tiếng Việt là tính phương ngữ, đặc trưng mỗi vùng miền rất khác nhau. Bên cạnh, quá trình đào tạo AI và làm việc với các chuyên gia ngôn ngữ khiến các kỹ sư SRV nhận ra một phát sinh lớn nữa là Tiếng Việt trong đời sống thường nhật đang có rất nhiều thay đổi so với kho dữ liệu được cập nhật trước đó. Nói cách khác, những từ lóng của GenZ, của người dùng Internet hay các tên phim, người nổi tiếng, sự kiện quốc tế được người trẻ cập nhật mỗi ngày. Do đó đội ngũ R&D cũng phải cập nhật các dữ liệu này cho AI.

Cùng lúc đó, các kỹ sư kiểm thử cũng phải ra môi trường thực tế để kiểm nghiệm khả năng hoạt động ngoài đời thực của AI trong nhiều điều kiện khác nhau. Kỹ sư SRV có lúc ra Hồ Gươm, lúc lên xe bus, vào quán cafe…. để kiểm thử trong môi trường thực tế, đảm bảo GenAI có thể hoạt động chính xác nhất trong mọi điều kiện.

Kỹ sư Trần Tuấn Minh và nhóm kỹ sư thường xuyên họp trao đổi trong quá trình thực hiện dự án

Quá trình để một sản phẩm mới đi từ phòng nghiên cứu đến tay người dùng đầu cuối luôn phải trải qua một công đoạn quan trọng là kiểm thử. "Dù SRV là trung tâm lớn nhất ngoài Hàn Quốc chịu trách nhiệm kiểm thử các thiết bị mạng, chúng tôi phải đối mặt thử thách lớn là các kỹ sư kiểm thử của SRV khi đó không biết nhiều về AI", Tuấn Minh nhớ lại. Trong vòng 4 tháng, SRV được các kỹ sư Hàn Quốc bàn giao công nghệ và kinh nghiệm về kiểm thử AI. Mọi người vừa học vừa làm và chạy đua với thời gian để kịp đưa Tiếng Việt lên Galaxy AI trong sự kiện Unpacked. Theo Tuấn Minh, từ số 0 tròn trĩnh về kiểm nghiệm AI, các kỹ sư Việt giờ đây không chỉ kiểm thử toàn bộ các tính năng trên Galaxy AI mà còn chuyển giao công nghệ, quy trình kiểm thử và kinh nghiệm cho các kỹ sư trong khu vực Đông Nam Á.

Triết lý kinh doanh và cam kết lâu dài của Samsung tại Việt Nam

Những câu chuyện trên cho thấy những cam kết và hành động thiết thực của Samsung tại Việt Nam. Không chỉ nỗ lực đưa tiếng Việt thành một trong 13 ngôn ngữ đầu tiên được hỗ trợ trên Galaxy AI, Samsung còn nỗ lực bàn giao những công nghệ mới nhất, hiện đại nhất cho kỹ sư Việt. Từ đó giữ đúng lời hứa với Chính phủ Việt Nam khi quyết tâm đưa Việt Nam vượt qua vai trò là cứ điểm sản xuất để trở thành cứ điểm chiến lược về R&D của Samsung trên toàn cầu.

Toàn cảnh Trung Tâm R&D Samsung Việt Nam

Từ những ngày đầu thành lập đến nay, Trung tâm Nghiên cứu và Phát triển vẫn giữ nguyên triết lý kinh doanh của Samsung là sự phát triển của công ty luôn đồng hành sự phát triển chung của xã hội. SRV đặc biệt chú trọng đến hoạt động hợp tác với các trường đại học để thu hút nguồn nhân tài trong nước và đồng hành cùng sự phát triển của công nghệ thông tin tại Việt Nam. Từ những hợp tác trong lĩnh vực phần mềm, Samsung Việt Nam đã mở rộng hợp tác sang lĩnh vực phần cứng và cả những khóa học liên quan đến công nghệ mới như AI, Big Data, IoT….

Ông Choi Joo Ho, Tổng giám đốc Tổ hợp Samsung Việt Nam nhận định những tính năng mới trên Galaxy AI của Samsung hiện nay có sự đóng góp rất lớn của kỹ sư Việt Nam. Từ nỗ lực đưa Tiếng Việt trở thành một trong những ngôn ngữ đầu tiên được hỗ trợ tính năng GenAI đến việc kỹ sư Việt đang nghiên cứu, bàn giao những công nghệ mới nhất cho các kỹ sư trong khu vực, SRV đang cho thấy những trái ngọt từ việc vun trồng những nhân tài trong hơn 20 năm Samsung có mặt tại Việt Nam. Đó không chỉ là cam kết của Samsung dành cho người dùng Việt Nam mà còn là những đóng góp quan trọng về chuyển giao công nghệ, bồi dưỡng nhân tài, đưa Việt Nam thành một trong những cứ điểm quan trọng trong khu vực và cả thế giới.