AI & Data: Ý nghĩa và vai trò của dữ liệu

28/06/2023 10:00 GMT+7

Artificial Intelligence, hay AI, là một ngành khoa học kỹ thuật nhằm mô phỏng trí thông minh của con người trong máy móc, giúp những cỗ máy có khả năng tiếp nhận và xử lý thông tin từ cơ bản đến phức tạp, có thể tự suy nghĩ và hành động giống như con người. Điểm nổi bật ở AI là có thể xử lý một lượng dữ liệu lớn với tốc độ nhanh vượt trội so với con người.

A.I & Data: Ý nghĩa và vai trò của dữ liệu - Ảnh 1.

Lịch sử của AI - Trí tuệ nhân tạo

Thực tế, ý tưởng về "một cỗ máy biết suy nghĩ" đã có từ thời Hy Lạp cổ đại, nhưng mãi cho tới khi máy tính điện tử ra đời, thuật ngữ AI mới trở nên phổ biến hơn. Một trong những dấu mốc quan trọng là khi Alan Turing đề xuất "Phép thử Turing" vào năm 1950 để xác định xem một cỗ máy có thông minh hay không.

Đến những năm 1980, thuật ngữ Machine Learning (học máy) ra đời nhờ tận dụng thuật toán lan truyền ngược để tạo ra mạng nơ-ron nhân tạo. Machine Learning là cách dạy cho máy để nó tự xử lý một công việc cụ thể bằng cách sử dụng các thuật toán phân tích thông tin sẵn có và tự học để đưa ra các quyết định và dự đoán sự kiện liên quan. Trong Machine Learning, Deep Learning tạo ra mạng nơ-ron nhân tạo đa tầng, mỗi tầng có nhiều nút mạng và số tầng càng cao thì mạng càng "sâu", có thể tư duy như não người.

4 loại trí tuệ nhân tạo

Dựa trên độ phức tạp của các nhiệm vụ mà hệ thống có thể thực hiện, AI có thể được chia làm 4 loại, bao gồm:

1. AI phản ứng (Reactive Machine AI):

Nhận thức và phản ứng tức thì với môi trường xung quanh khi thực hiện nhiệm vụ. Tuy nhiên, loại AI này không thể lưu trữ dữ liệu nên sẽ không thể dựa vào những "kinh nghiệm" trong quá khứ để đưa ra quyết định.

Dựa vào tốc độ xử lý nhanh, AI phản ứng thường được ứng dụng trong các hệ thống lọc thư rác, nhận diện khuôn mặt…

2. AI có bộ nhớ hạn chế (Limited Memory):

Loại AI có khả năng thu thập và lưu trữ dữ liệu, dựa vào quá khứ để dự đoán và đưa ra quyết định trong tương lai. Loại này phức tạp hơn và hiệu quả hơn so với loại AI phản ứng.

Ví dụ như Chat GPT-3, một chương trình chat-bot trả lời bằng văn bản giống con người, được xây dựng dựa trên phương pháp Deep Learning có thể trả lời các câu hỏi khó và dạy chúng ta trong hầu hết các lĩnh vực.

3. AI lý thuyết về tâm trí (Theory of Mind):

Loại AI này sẽ tập trung vào trí tuệ cảm xúc, có khả năng học và thể hiện cảm xúc như con người, đưa ra các hành động phù hợp dựa trên nhận thức của nó về cảm xúc của con người, động vật hay máy móc.

4. AI tự nhận thức (Self-Awareness AI):

Loại AI này sở hữu ý thức ở cấp độ con người và hiểu được sự tồn tại của chính nó trên thế giới, cũng như sự hiện diện và trạng thái cảm xúc của những người khác.

Nó có thể hiểu những gì người khác có thể cần dựa trên không chỉ những gì họ giao tiếp với họ mà còn cách họ giao tiếp.

Vai trò của dữ liệu & Phân biệt Fast Data, Big Data

Tất cả các loại AI đều cần dữ liệu để hoạt động và dữ liệu đóng vai trò cốt lõi. AI có thể được so sánh với sự phát triển của con người, từ khi mới sinh đến khi trưởng thành. Kiến thức và thông tin được dạy từ gia đình, trường học và bạn bè, sau đó được sử dụng để đưa ra các quyết định độc lập trong tương lai. Đối với AI, lượng dữ liệu càng lớn thì nó sẽ càng thông minh hơn, có khả năng đưa ra quyết định và hành động chính xác hơn.

Dựa vào từng loại AI, dữ liệu có thể chia ra làm 2 dạng:

1. Dữ liệu nhanh (Fast Data):

Là những dữ liệu được thu thập và xử lý theo thời gian thực, dung lượng dữ liệu thấp nhưng cần xử lý số lượng lớn, nhanh và liên tục. Ví dụ các cảm biến, camera trên xe tự hành sẽ thu thập các thông tin về khoảng cách, tốc độ, điều kiện giao thông trong thời gian thực để giúp xe đưa ra quyết định nhanh nhất, hay robot kiểm định chất lượng sản phẩm trong các dây chuyền sản xuất công nghiệp...

2. Dữ liệu lớn (Big Data):

Là các tập dữ liệu có cấu trúc và phi cấu trúc có kích thước, dung lượng lớn, được tổ chức và trích xuất thông qua ứng dụng AI. Dữ liệu từ máy tính, IoT, cảm biến, camera giám sát được lưu trữ tập trung. Sau đó, các ứng dụng AI sẽ học, phân tích, dự đoán và trả về các kết quả tùy vào yêu cầu cụ thể của từng lĩnh vực như: tài chính, an ninh, kinh doanh, E-commerce…

Hạ tầng lưu trữ cho Fast Data và Big Data cũng khác nhau, phụ thuộc và đặc tính của từng loại.

Fast Data cần độ trễ thấp và thường được triển khai cục bộ trên thiết bị hoặc hệ thống. Vì vậy, Nand Flash (bao gồm SSD, thẻ nhớ, bộ nhớ flash nhúng) là sự lựa chọn tốt nhất cho lưu trữ Fast Data. Trong khi đó, Big Data cần dung lượng lưu trữ cực lớn, được lưu trữ tập trung tại các trung tâm dữ liệu. Do đó, ổ cứng HDD là phù hợp nhất vì độ bền cao và sử dụng các công nghệ mới, giúp tiết kiệm điện năng tiêu thụ, giảm chi phí đầu tư và chi phí vận hành.

Lời kết

Tóm lại, AI sử dụng dữ liệu để phân tích và học hỏi, nhưng khả năng của nó bị giới hạn bởi số lượng thông tin được đưa vào hệ thống. Big Data cung cấp một lượng lớn thông tin, biến nó thành nguồn cung cấp nhiên liệu cho các hệ thống trí tuệ nhân tạo. Các hệ thống này có thể khai thác tài nguyên Big Data để đưa ra các quyết định và đề xuất tốt hơn.

Top

Bạn không thể gửi bình luận liên tục. Xin hãy đợi
60 giây nữa.