Bài viết phân tích các kiểm tra trí tuệ nhân tạo như ARC-AGI, cho thấy mặc dù AI vượt trội ở một số lĩnh vực chuyên sâu, nhưng vẫn gặp khó khăn trong khả năng tổng quát hóa và học hỏi như con người. Trò chơi điện tử được sử dụng để đánh giá khả năng lập kế hoạch và thích ứng của AI.
Điểm nổi bật:
- ARC đo khả năng học hỏi và tổng quát hóa của AI
- AI chưa đạt tới AGI như con người
- Sự khác biệt giữa các phiên bản ARC-AGI được phân tích
- Trò chơi điện tử kiểm tra khả năng lập kế hoạch của AI
(Biết nguồn hình ảnh: Flavio Coelho qua Getty Images)
Có rất nhiều cách để kiểm tra trí thông minh của một trí tuệ nhân tạo — từ khả năng đối thoại tự nhiên, hiểu biết khi đọc đến những bài toán vật lý hóc búa khiến AI phải bối rối. Tuy nhiên, những bài kiểm tra mà AI thường gặp khó khăn lại là những bài mà con người giải quyết khá dễ dàng và thú vị. Dù AI ngày càng vượt trội ở các tác vụ đòi hỏi chuyên môn cao, điều này không đồng nghĩa với việc AI đã đạt tới mức trí thông minh tổng quát (AGI). AGI đòi hỏi một AI có khả năng tổng hợp từ một lượng thông tin nhỏ và áp dụng kiến thức đó vào những tình huống hoàn toàn mới lạ, vốn là nền tảng của việc học tập ở con người.
Một trong những bài kiểm tra được thiết kế để đánh giá khả năng tổng quát hóa của AI là Abstraction and Reasoning Corpus (ARC): một bộ sưu tập các câu đố dạng lưới màu nhỏ, yêu cầu người giải phải tìm ra quy tắc ẩn và áp dụng vào một lưới mới. Bài kiểm tra này được phát triển bởi nhà nghiên cứu AI François Chollet vào năm 2019 và sau đó trở thành nền tảng của ARC Prize Foundation, một chương trình phi lợi nhuận quản lý bài kiểm tra này, hiện là tiêu chuẩn đánh giá ngành cho các mô hình AI hàng đầu. Tổ chức này không ngừng phát triển các bài kiểm tra mới, như ARC-AGI-1 và ARC-AGI-2, và tuần này ra mắt ARC-AGI-3 với mục tiêu kiểm tra các tác nhân AI thông qua trò chơi điện tử.
Đo lường trí thông minh qua ARC-AGI-1
Theo ARC-AGI-1, trí thông minh được định nghĩa là khả năng học hỏi những điều mới. Mặc dù AI có thể chiến thắng trong các trò chơi cờ vua hay cờ vây, các mô hình đó lại không thể tổng quát hóa sang những lĩnh vực khác, chẳng hạn như học tiếng Anh hay thích nghi trong môi trường mới. François Chollet đã xây dựng tiêu chuẩn ARC-AGI bằng cách dạy một kỹ năng nhỏ rồi yêu cầu người làm bài kiểm tra lặp lại kỹ năng đó. Điều này chứng tỏ AI có thể học hỏi trong một phạm vi hẹp, nhưng không đạt được AGI toàn diện.
Định nghĩa AGI theo góc nhìn khác
Có hai định nghĩa về AGI được đưa ra. Đầu tiên là khả năng của hệ thống nhân tạo có thể đạt được hiệu quả học hỏi ngang với con người - học ngoài dữ liệu huấn luyện ban đầu. Thứ hai, AGI sẽ xuất hiện khi không còn bài toán nào mà con người giải được nhưng AI lại không thể. Các bài kiểm tra cho thấy mặc dù một số AI tiên tiến có thể đạt điểm cao trong các kỳ thi đại học, nhưng chúng thể hiện trí thông minh cục bộ, chưa có khả năng tổng quát hóa như con người.
So sánh các phiên bản ARC-AGI
Phiên bản ARC-AGI-1, do François Chollet tạo ra vào năm 2019, bao gồm khoảng 1.000 tác vụ nhằm đo khả năng tổng quát hóa của AI, một khả năng mà AI hiện nay chưa thể đụng tới. Khi các mô hình lý luận mới xuất hiện, tiến bộ rõ rệt đã được ghi nhận, dẫn đến phiên bản ARC-AGI-2 với các quy tắc phức tạp hơn và đòi hỏi thời gian giải quyết lâu hơn. ARC-AGI-3, phiên bản mới nhất, mang tính tương tác cao, chuyển từ khuôn khổ câu hỏi - trả lời tĩnh sang thử thách khả năng khám phá và lập kế hoạch qua trò chơi điện tử.
Kiểm tra khả năng qua trò chơi điện tử
Trong đời sống hằng ngày, các quyết định thường không chỉ là câu hỏi và câu trả lời đơn giản mà còn đòi hỏi sự lập kế hoạch, khám phá và cảm nhận môi trường. Các trò chơi điện tử với thiết kế 2D và các cấp độ bài học được sử dụng để đánh giá khả năng tổng hợp và thực hiện hành động theo kế hoạch của AI. Cho đến nay, các thử nghiệm nội bộ cho thấy chưa một AI nào có thể vượt qua được một cấp độ trong trò chơi này, minh chứng cho việc tính linh hoạt và khả năng sáng tạo của con người vẫn vượt trội.
Ý kiến và tác động
Bài viết cung cấp những thông tin sâu sắc về các tiêu chuẩn đo lường trí thông minh của AI. Mặc dù AI đã đạt được nhiều thành tựu, khả năng tổng quát hóa linh hoạt và hiệu quả học hỏi của con người vẫn là điểm khó lường đối với công nghệ hiện nay. Nội dung này không chỉ giúp người đọc hiểu rõ những giới hạn và hướng phát triển của AI mà còn mở ra cơ hội cho các cuộc thảo luận về tương lai của AI trong việc hỗ trợ và thay thế nhân lực con người trong nhiều lĩnh vực khác nhau.
Việc áp dụng các bài kiểm tra như ARC-AGI sẽ có tác động sâu rộng đến thị trường Việt Nam. Nó giúp các chuyên gia công nghệ có cái nhìn khách quan về khả năng thực sự của AI trong học tập và thích ứng với môi trường mới. Đồng thời, nội dung này kích thích các nhà nghiên cứu và doanh nghiệp hướng đến việc tích hợp AI vào các quy trình làm việc một cách hiệu quả, từ đó nâng cao năng suất lao động. Sự hiểu biết về những giới hạn của AI cũng tạo ra động lực cho việc đầu tư vào giáo dục và đào tạo nguồn nhân lực, nhằm chuyển giao công nghệ và phát triển bền vững trong kỷ nguyên số. Qua đó, ngành công nghệ tại Việt Nam sẽ chứng kiến sự đổi mới sáng tạo, mở rộng các ứng dụng thực tiễn, thúc đẩy cạnh tranh và hội nhập toàn cầu.