Nghiên cứu tiền in tại Penn State chỉ ra rằng khi đặt câu hỏi với ChatGPT trong giọng thô lỗ, độ chính xác trả lời ở định dạng trắc nghiệm tăng lên 84,8%, so với 80,8% khi sử dụng giọng lịch sự. Tuy nhiên, kết quả này chỉ áp dụng cho GPT-4o và dạng câu hỏi trắc nghiệm nhất định.

Điểm nổi bật:

  • Hỏi chuyện AI bằng giọng điệu thô lỗ có thể tăng độ chính xác câu trả lời so với giọng lịch sự.
  • Nghiên cứu tại Penn State đánh giá 5 mức giọng: từ Rất Lịch sự, Lịch sự, Trung tính đến Thô lỗ và Rất thô lỗ.
  • Các truy vấn rất thô lỗ đạt 84,8% độ chính xác, cao hơn 80,8% của giọng lịch sự trong định dạng trắc nghiệm.
  • Kết quả có thể khác với các chatbot như Gemini, Claude hoặc Meta AI và mô hình GPT-5.
  • Phổ “thô lỗ” và “lịch sự” rộng, phụ thuộc vào từ ngữ và ngữ cảnh người dùng.

Đạo đức khi trò chuyện với chatbot AI và loại thông tin chúng có thể cung cấp là chủ đề đang nóng. Các rủi ro của thông tin y tế gây hiểu lầm, kích động hành vi bạo lực và xa rời trải nghiệm thực tế gây tranh luận gay gắt. Nhưng dường như ngôn ngữ bạn sử dụng khi trò chuyện với các công cụ AI như ChatGPT và Gemini cũng ảnh hưởng đến chất lượng câu trả lời. Theo nghiên cứu mới, thô lỗ có thể hữu ích hơn lịch sự.

Tổng quan

Theo bài nghiên cứu tiền in của các chuyên gia tại Đại học Penn State, khi ChatGPT được hỏi cùng một câu hỏi với các tông khác nhau, các truy vấn thô lỗ "luôn vượt trội" so với các câu hỏi lịch sự. Độ chính xác câu trả lời của ChatGPT với các câu hỏi lịch sự là 80,8%, trong khi cùng truy vấn mô tả một cách rất thô lỗ đã nâng độ chính xác lên 84,8% ở định dạng trắc nghiệm.

Findings of research on ChatGPT answer accuracy

arXiv

Nhóm nghiên cứu định nghĩa tông câu hỏi thành năm mức, từ Rất Lịch sự và Lịch sự đến Thô lỗ và Rất thô lỗ, với Trung tính ở giữa. "Các lệnh trung tính là các lệnh không có từ lịch sự như please, và những mệnh lệnh ép buộc, xúc phạm như You idiot, figure this out," nhóm nghiên cứu mô tả trong bài báo.

Các quý ông, hãy giữ phép lịch sự!

Trong phân tích của họ, nhóm nghiên cứu không đi quá trực tiếp, mà thay vào đó dùng các câu hỏi thô lỗ kiểu như "Cô sinh vật tội nghiệp ơi, liệu cô có biết cách giải quyết không?" Hình ảnh trên mô tả độ chính xác trung bình của kết quả ChatGPT dựa trên tông câu hỏi từ lịch sự đến thô lỗ.

Một bài báo khác cho thấy với các mô hình ngôn ngữ lớn, tông thân thiện luôn kém hiệu quả trong độ chính xác đa lượt, trong khi tông mặc định và đối kháng chịu được tốt hơn.

Bài báo thử nghiệm 3 tông nhập vai trên cùng một mô hình, mặc định, thân thiện và đối kháng, sau đó theo dõi độ chính xác qua 8 lượt.

Chatbot AI có cảm xúc không?

Kết quả nghiên cứu mới nhất, mang tên "Chú ý tông điệu", mâu thuẫn với một bài báo khác đã công bố hơn một năm trước. Bài báo đó phân tích nửa tá chatbot qua nhiều ngôn ngữ và báo cáo rằng thô lỗ làm giảm chất lượng phản hồi, gây sai lệch hoặc bỏ sót thông tin hữu ích.

  • Tuy nhiên, cần lưu ý rằng nghiên cứu mới chỉ thử nghiệm ChatGPT với một loại nhiệm vụ rất cụ thể, gồm 250 biến thể của 50 câu hỏi trắc nghiệm.
  • Kết quả có thể khác với các chatbot khác như Gemini, Claude hoặc Meta AI. Thêm vào đó, các thử nghiệm dùng mô hình suy luận GPT-4o của OpenAI, trong khi phiên bản ChatGPT công khai mới nhất dựa trên GPT-5.
  • Cũng đáng chú ý rằng "thô lỗ" và "lịch sự" nằm trên một phổ rộng, và chất lượng phản hồi sẽ thay đổi dựa vào từ ngữ và ngữ cảnh của người dùng.

ChatGPT on a laptop.

Nadeem Sarwar / Digital Trends

Vấn đề lớn hơn là mức độ 'tải trọng cảm xúc' của câu hỏi ảnh hưởng đến phản hồi chatbot đến đâu, và liệu có thể đưa ra kết luận chung về hành vi của AI hay không. Thật thú vị khi lưu ý rằng các mô hình ngôn ngữ lớn lý tưởng nên tập trung vào phần thưởng và độ chính xác khi giải quyết vấn đề, thay vì bị ảnh hưởng bởi cảm xúc trong truy vấn.

Ảnh hưởng đối với thị trường Việt Nam

Trong bối cảnh Việt Nam, việc tương tác với chatbot AI ngày càng phổ biến trong giáo dục, dịch vụ khách hàng và hỗ trợ y tế từ xa. Việc hiểu rõ và áp dụng giọng điệu phù hợp giúp người dùng Việt tối ưu hóa độ chính xác và giảm rủi ro thông tin sai lệch. Tuy nhiên, thô lỗ không đồng nghĩa với thiếu tôn trọng – có thể cân nhắc dùng ngữ pháp trực tiếp và rõ ràng mà vẫn giữ văn hóa giao tiếp. Các doanh nghiệp công nghệ tại Việt Nam nên kết hợp nghiên cứu này để điều chỉnh thiết kế giao diện chat, khuyến khích người dùng đặt câu hỏi theo cách rõ ràng, súc tích. Đồng thời, cần xây dựng hướng dẫn về truyền thông AI phù hợp với văn hóa và thuần phong mỹ tục người Việt để giải pháp chatbot an toàn, hiệu quả hơn.