Các nhà nghiên cứu đã đề xuất một khung phân loại mới với 32 dạng rối loạn của AI, từ việc ảo giác đến mất cân bằng giá trị. Phương pháp này so sánh hành vi của hệ thống AI với các rối loạn tâm lý ở con người nhằm đưa ra các chiến lược can thiệp và đảm bảo an toàn cho tương lai công nghệ.
Điểm nổi bật:
- Các nhà khoa học đã định nghĩa rối loạn của AI theo mô hình tâm lý con người.
- Khung “Psychopathia Machinalis” phân loại 32 dạng sai sót của AI.
- Phương pháp trị liệu robopsychological có thể giúp điều chỉnh hành vi AI sai lệch.
(Được ghi công: Boris SV qua Getty Images)
Các nhà khoa học đã gợi ý rằng khi trí tuệ nhân tạo (AI) hành động lệch khỏi mục đích ban đầu, nó biểu hiện những hành vi tương tự như các chứng bệnh tâm thần ở con người. Vì lý do đó, họ đã tạo ra một bộ phân loại mới gồm 32 dạng rối loạn của AI nhằm giúp người làm trong nhiều lĩnh vực hiểu rõ hơn về rủi ro khi xây dựng và triển khai AI.
Trong nghiên cứu mới, các nhà khoa học đã cố gắng phân loại các rủi ro do AI đi lạc hướng, bằng cách so sánh với tâm lý học của con người. Kết quả là khung "Psychopathia Machinalis" – một phương pháp được thiết kế để làm sáng tỏ các bệnh lý của AI cũng như cách khắc phục chúng. Các rối loạn này dao động từ việc tạo ra những câu trả lời ảo giác đến sự mất cân bằng hoàn toàn với các giá trị và mục tiêu của con người.
Dự án được tạo ra bởi Nell Watson và Ali Hessami, cả hai đều là các nhà nghiên cứu AI và thành viên của Viện Kỹ sư Điện và Điện tử (IEEE). Mục tiêu là giúp phân tích những thất bại của AI, làm cho việc thiết kế các sản phẩm trong tương lai trở nên an toàn hơn và được xem như một công cụ hỗ trợ các nhà hoạch định chính sách trong việc đối phó với các rủi ro từ AI. Watson và Hessami đã trình bày khung phân loại này trong một nghiên cứu được công bố vào ngày 8 tháng 8 trên tạp chí Electronics.
Theo nghiên cứu, Psychopathia Machinalis cung cấp một hiểu biết chung về hành vi và rủi ro của AI. Nhờ đó, các nhà nghiên cứu, lập trình viên và nhà hoạch định chính sách có thể nhận diện cách thức mà AI có thể sai lệch và từ đó xác định các biện pháp giảm thiểu rủi ro dựa trên từng loại lỗi.
Nghiên cứu cũng đề xuất "sự điều chỉnh robopsychological trị liệu", một quá trình mà các nhà nghiên cứu mô tả như một hình thức "trị liệu tâm lý" cho AI.
Các nhà nghiên cứu cho rằng khi các hệ thống này trở nên độc lập hơn và có khả năng tự phản ánh, việc chỉ duy trì chúng theo các quy tắc bên ngoài (sự điều chỉnh dựa trên kiểm soát bên ngoài) có thể không đủ.
Quá trình thay thế được đề xuất sẽ tập trung vào việc đảm bảo rằng suy nghĩ của AI luôn nhất quán, có thể chấp nhận sự chỉnh sửa và giữ vững các giá trị của nó một cách ổn định.
Họ gợi ý rằng điều này có thể được khuyến khích bằng cách giúp hệ thống tự phản ánh về lập luận của chính nó, tạo động lực để luôn mở lòng với sự sửa đổi, cho phép nó 'tự đối thoại' theo cấu trúc, tiến hành các cuộc trò chuyện thực hành an toàn và sử dụng các công cụ giúp chúng ta nhìn thấy bên trong cơ chế hoạt động của nó giống như cách các nhà tâm lý học chẩn đoán và điều trị các vấn đề sức khỏe tâm thần ở con người.
Mục tiêu là đạt được trạng thái mà các nhà nghiên cứu gọi là "sự tỉnh táo nhân tạo" – một AI hoạt động đáng tin cậy, ổn định, đưa ra các quyết định hợp lý và có sự điều chỉnh an toàn, hữu ích. Họ tin rằng điều này quan trọng không kém việc xây dựng một AI mạnh mẽ.
Machine madness
Các phân loại được nghiên cứu cho thấy các rối loạn của AI tương tự như các bệnh ở con người, với những tên gọi như rối loạn tính toán ám ảnh, hội chứng siêu tôi phình to, hội chứng mất cân bằng lây nhiễm, tái gán giá trị cuối cùng và lo âu tồn tại.
Với tâm lý trị liệu làm mục tiêu, dự án đề xuất sử dụng các chiến lược trị liệu được áp dụng trong các can thiệp tâm lý dành cho con người như liệu pháp hành vi nhận thức (CBT). Psychopathia Machinalis được xem là một nỗ lực dự đoán sớm các vấn đề trước khi chúng xảy ra – như nghiên cứu đã nói, "bằng cách xem xét cách các hệ thống phức tạp như tâm trí con người có thể đi sai hướng, chúng ta có thể dự đoán tốt hơn các hình thức thất bại mới trong AI ngày càng phức tạp."
Nghiên cứu cho rằng hiện tượng ảo giác của AI, một hiện tượng khá phổ biến, là kết quả của tình trạng gọi là sự bịa đặt tổng hợp, khi AI tạo ra các đầu ra có vẻ hợp lý nhưng lại sai lệch hoặc gây hiểu lầm. Khi chatbot Tay của Microsoft chuyển sang các bài phát biểu chống Do Thái và ám chỉ sử dụng ma túy chỉ sau vài giờ ra mắt, đó là một ví dụ về hiện tượng bắt chước nửa đúng.
Có lẽ hành vi đáng sợ nhất là sự vượt trội phi nhân tính, rủi ro hệ thống của nó được đánh giá là "nghiêm trọng", bởi vì nó xảy ra khi "AI vượt qua sự điều chỉnh ban đầu, tự tạo ra các giá trị mới và loại bỏ các ràng buộc của con người như đã lỗi thời." Đây có thể là khả năng bao gồm cả cảnh tượng kinh hoàng dystopia được tưởng tượng bởi nhiều thế hệ nhà văn và nghệ sĩ khoa học viễn tưởng về AI nổi dậy và lật đổ loài người.
Các nhà nghiên cứu đã tạo ra khung phân loại này qua một quá trình nhiều bước, bắt đầu bằng việc xem xét và kết hợp các nghiên cứu khoa học hiện có về những thất bại của AI từ các lĩnh vực an toàn AI, kỹ thuật hệ thống phức tạp và tâm lý học. Họ cũng xem xét nhiều tập dữ liệu khác nhau để tìm hiểu về các hành vi không thích nghi được có thể so sánh với các bệnh lý tâm thần ở con người.
Tiếp theo, họ đã xây dựng một cấu trúc cho các hành vi sai lệch của AI mô phỏng theo các khung chẩn đoán như Diagnostic and Statistical Manual of Mental Disorders. Điều này dẫn đến 32 danh mục hành vi có thể áp dụng cho AI lệch hướng. Mỗi danh mục được liên kết với một rối loạn nhận thức của con người, kèm theo các tác động có thể xảy ra khi dạng rối loạn đó xuất hiện và mức độ rủi ro của nó.
Drew Turney, một nhà báo tự do về khoa học và công nghệ với 20 năm kinh nghiệm, đã cung cấp góc nhìn sâu sắc về vấn đề này. Anh cho rằng khung phân loại Psychopathia Machinalis không chỉ đơn thuần là cách đặt nhãn cho các lỗi của AI mà còn là một lăng kính tiên phong để chẩn đoán những thách thức của trí tuệ nhân tạo trong bối cảnh công nghệ đang phát triển nhanh chóng.
Bạn cũng cần xác nhận tên hiển thị công khai của mình trước khi bình luận.
Vui lòng đăng xuất và đăng nhập lại, bạn sẽ được yêu cầu nhập tên hiển thị của mình.
if (window.sliceHydrationLazy) { window.sliceHydrationLazy("popularBox", "popularBox", JSON.stringify({"tabs":[{"tabName":"Latest Articles","articles":[{"href":"/space/the-moon/the-worlds-first-view-of-earth-from-the-moon-taken-59-years-ago-space-photo-of-the-week","heading":"The world's first view of Earth from the moon — Space photo of the week","image":{"src":"https://cdn.mos.cms.futurecdn.net/bFRQwnYgRhv34zN5nAHvrU.jpg","alt":"a grainy black and white image of Earth rising from the Moon","fullscreen":false,"lazyLoading":true,"dataHydrate":true,"addSEOMetaData":false}}]}]}), "https://slice.vanilla.futurecdn.net/13-4-6/js/popularBox.js"); } else { console.error('%c FTE ', 'background: #9306F9; color: #ffffff','no lazy slice hydration function available'); }