Những câu hỏi mở trong nghiên cứu học máy

TS Đoàn Thành Nam
(Nhà khoa học dữ liệu, Công ty Factor.io, Mỹ)
09/02/2023 09:32 GMT+7

Trí tuệ nhân tạo (AI) nói chung và học máy (Machine Learning - ML) nói riêng đã, đang và sẽ tiếp tục phát triển trong hiện tại và tương lai.

Chúng ta có quyền hy vọng ở tương lai gần, máy móc sẽ làm được những điều không tưởng nhằm giúp con người nâng cao hiệu suất làm việc, học tập cũng như xử lý thông tin. Ví dụ, ChatGPT sẽ giúp con người soạn thảo nhanh những văn bản thường nhật hoặc đóng vai trò như 1 trợ lý ảo giúp truy xuất thông tin một cách nhanh chóng. Tuy nhiên, ngành nghiên cứu này cũng đang đối mặt với những thách thức không hề nhỏ đòi hỏi sự nỗ lực của những nhà khoa học nhằm tạo ra những thuật toán AI - ML tốt hơn nữa. Trong bài báo này, chúng ta cùng điểm qua một vài thách thức với ngành nghiên cứu này.

Những câu hỏi mở trong nghiên cứu học máy - Ảnh 1.

Trí tuệ nhân tạo đang ngày càng ảnh hưởng đến nhân loại

Reuters

Tính giải thích của hệ thống AI/ML

Thử tưởng tượng chúng ta có 1 con robot vô cùng chính xác để thực hiện phẫu thuật với tỷ lệ chính xác gần 100% nhưng con robot nhận đầu vào là bệnh án của bệnh nhân và đầu ra chỉ là thông báo vô hồn là bệnh nhân phải thực hiện phẫu thuật này mà không có một lời giải thích. Việc đó thực sự khó chấp nhận khi so sánh với việc bệnh nhân đó được tư vấn bởi 1 bác sĩ giỏi chỉ có tỷ lệ phẫu thuật thành công là 90% giải thích cặn kẽ tại sao lại phải làm phẫu thuật này.

Ví dụ trên cho thấy sự minh bạch/giải thích được trả về của những hệ thống AI/ML là điều vô cùng cần thiết trong các ứng dụng ảnh hưởng trực tiếp tới con người. Nhưng để đạt sự chính xác thì những hệ thống AI ngày càng phức tạp và càng khó đưa ra được lời giải thích cho dự đoán của mình. Hiện tại hầu như mọi hệ thống AI được sử dụng như một "hộp tối" (black box) nên để AI có thể được áp dụng vào những lĩnh vực như sức khỏe, phẫu thuật thì tính minh bạch và giải trình của hệ thống càng phải được quan tâm nhiều hơn. Nói một cách khác thì những giải thuật AI đã và đang tìm kiếm những tương quan (correlation) dựa trên dữ liệu mà bỏ quên quan hệ nhân quả (causality) của những đặc trưng khi xây dựng mô hình tính toán.

Nhưng ngay cả khi hệ thống AI đưa ra được lời giải thích cho dự đoán, thì liệu rằng chúng ta - người không có kiến thức gì về y học - có thể chấp nhận robot thực hiện phẫu thuật cho mình không?

Tính công bằng trong AI

Năm 2015, ứng dụng Google Photos đã tự động đánh dấu 1 bức hình kỹ sư Jacky Alciné và bạn là "khỉ đột" chỉ vì họ là người da đen. Facebook cũng mắc 1 lỗi tương tự vào năm 2020 khi tự ý dán nhãn 1 đoạn phim về người da đen. Cả hai vụ việc đều gây ra những tổn thất về danh tiếng cho 2 đại gia công nghệ. Đồng thời hai ví dụ trên cho thấy những hệ thống AI cũng có những lỗ hổng lớn trong việc đem lại sự công bằng cho tất cả mọi người.

Nhằm nâng cao độ chính xác của hệ thống máy học, những thông tin "nhạy cảm" như giới tính, chủng tộc của người dùng sẽ được sử dụng cho máy học. Điều này được củng cố bởi niềm tin rằng càng nhiều dữ liệu thì AI càng thông minh và AI có thể tự động điều tiết, hiểu được các đặc trưng mà không cần sự can thiệp của con người. Từ đó vô hình trung làm cho AI thiên vị một đặc tính nào đó của người dùng và làm trầm trọng hơn sự thiên lệch trong AI. Thử tưởng tượng hệ thống AI luôn đánh giá thấp khả năng trả nợ của những nhóm dễ bị tổn thương như người vô gia cư, người khuyết tật thì làm sao họ có thể tiếp cận được những cơ hội để thay đổi cuộc đời?

Trở lại với 2 ví dụ của Google và Facebook, chúng ta có thể thấy tính công bằng trong các hệ thống AI là một điều không hề dễ dàng. Ngay cả những đại công ty công nghệ với sự đầu tư nghiêm túc về AI cũng hoàn toàn có thể phạm phải những lỗi như trên.

Giảm giá thành của hệ thống AI

Sự phát triển của AI/ML đã mang những bước tiến lớn, trong một số tác vụ thì máy tính đã hoàn toàn đánh bại con người. Một ví dụ điển hình là việc DeepMind, một công ty con của Google đã xây dựng AlphaGo để đánh bại kỳ thủ cờ vây 9 đẳng Lee Sedol vào năm 2016. Nhưng để xây dựng nên AlphaGo, DeepMind đã tiêu tốn một số tiền không nhỏ cho nhân sự, phần cứng. Chúng ta không biết chính xác số tiền mà DeepMind đã dùng nhưng với việc xây dựng AlphaGo Zero - bản cập nhật của AlphaGo tốn khoảng 25 triệu đô la phần cứng thì chi phí của AlphaGo không thể thấp hơn con số trên.

Một ví dụ khác để thấy sự đắt đỏ của những hệ thống AI là chúng ta đã và đang tiêu hàng tỉ đô la với hy vọng sẽ xây dựng được những chiếc xe hơi tự lái mà không cần sự can thiệp của con người. Nhưng đã nhiều năm trôi qua, không một công ty xe hơi nào có thể đảm bảo sẽ thương mại hóa một sản phẩm như vậy. Để so sánh với con người, thì chúng ta chỉ cần 1 ổ bánh mì và ít nước đã có thể điều khiển 1 chiếc xe trong nhiều giờ.

Giáo sư Kaushik Roy của Đại học Purdue đã ước tính rằng cho cùng một tác vụ, não bộ con người chỉ sử dụng 1/1.000 năng lượng so với các hệ thống học sâu và học máy hiện hành. Do đó giảm thiểu điện năng sử dụng và chi phí của những hệ thống AI sẽ giúp chúng ta xây dựng được những thuật toán hoàn thiện hơn, giá rẻ hơn, dễ dàng tiếp cận với số đông nhân loại. Ngoài ra, những hệ thống AI giá rẻ sẽ giúp những nước đang phát triển có thể tham gia nghiên cứu và đóng góp nhiều hơn cho sự tiến bộ của nhân loại.

Trí tuệ nhân tạo đã và đang làm một cuộc cách mạng thay đổi hoàn toàn cuộc sống của con người, nhưng để giúp ích hơn nữa cho con người thì AI sẽ phải được cải tiến hơn nữa. Trên đây chỉ là một vài thách thức cơ bản cho ngành AI và cũng là thách thức của những nhà khoa học để có thể giúp ích nhiều hơn cho nhân loại.

Top

Bạn không thể gửi bình luận liên tục. Xin hãy đợi
60 giây nữa.