Kiến thức chuyên đề

Bài #6: Hallucination là gì? Kiểm chứng và nguồn tham khảo khi dùng LLM

29/06/2026
11 lượt xem

Bài #6: Hallucination là gì? Kiểm chứng và nguồn tham khảo khi dùng LLM

Ở các bài trước, ta đã biết LLM tạo câu trả lời bằng cách dự đoán token tiếp theo dựa trên context. Khả năng này giúp LLM giải thích bài học, tóm tắt văn bản, viết ví dụ và trò chuyện tự nhiên. Nhưng nó cũng có một rủi ro quan trọng: đôi khi câu trả lời nghe rất mạch lạc lại sai, thiếu căn cứ hoặc không thể kiểm chứng.

Hiện tượng này thường được gọi là hallucination. Dịch sát là “ảo giác”, nhưng trong bối cảnh AI, hãy hiểu đơn giản là: mô hình sinh ra thông tin có vẻ hợp lý, trong khi thông tin đó không đúng, bị nhầm, bị ghép sai ngữ cảnh, hoặc không có nguồn đáng tin.

Sơ đồ tự tạo: hallucination xảy ra khi câu trả lời AI nghe hợp lý nhưng chưa được chứng minh; người dùng cần tách dữ kiện then chốt, tìm nguồn chính và ghi rõ mức chắc chắn.

Mục tiêu bài học

Sau bài này, bạn cần nắm được: hallucination là gì; vì sao LLM có thể tạo thông tin sai; khi nào lỗi này nguy hiểm; cách kiểm chứng câu trả lời; và cách yêu cầu LLM trình bày nguồn tham khảo một cách có trách nhiệm hơn.

Minh họa hoạt động kiểm chứng thông tin bằng biểu tượng kính lúp và dấu kiểm — Kiểm chứng là thói quen quan trọng khi dùng AI để học tập và làm việc. Nguồn ảnh: Wikimedia Commons, Muze'n, CC BY-SA 4.0.

Hallucination là gì?

Hallucination trong LLM là hiện tượng mô hình tạo ra thông tin không chính xác nhưng trình bày như thể đó là sự thật. Ví dụ, AI có thể bịa tên nghiên cứu, nhầm năm xuất bản, gán sai câu nói cho một nhân vật, tạo link không tồn tại, hoặc giải một bài toán với kết quả sai.

Điểm khó chịu là hallucination không phải lúc nào cũng dễ nhận ra. Nếu AI trả lời lúng túng, ta sẽ nghi ngờ ngay. Nhưng nhiều khi câu trả lời sai lại rất trơn tru, có cấu trúc đẹp, có thuật ngữ chuyên môn và nghe tự tin. Người mới học dễ bị thuyết phục vì hình thức quá “chuyên nghiệp”.

Vì sao LLM có thể bịa thông tin?

LLM không hoạt động như một cuốn từ điển luôn mở đúng trang. Nó dự đoán chuỗi token có khả năng phù hợp với context. Khi context thiếu dữ kiện, câu hỏi mơ hồ hoặc chủ đề cần thông tin mới, mô hình vẫn có thể tạo câu trả lời trôi chảy. Nói cách khác, “hợp lý về ngôn ngữ” không đồng nghĩa với “đúng về sự thật”.

Một lý do khác là context có thể bị nhiễu. Nếu người dùng đưa vào tài liệu sai, hoặc hỏi theo kiểu đã giả định một điều không đúng, mô hình có thể đi theo giả định đó. Ví dụ: “Tóm tắt cuốn sách X của tác giả Y” trong khi tác giả Y chưa từng viết cuốn đó.

Ví dụ đời thường

Hãy tưởng tượng bạn hỏi một người bạn: “Quán phở gần trường mình mở cửa đến 11 giờ đúng không?” Người bạn không chắc, nhưng vẫn trả lời tự tin: “Đúng rồi.” Nếu bạn đi lúc 10 giờ 30 và quán đã đóng, vấn đề nằm ở việc thông tin chưa được kiểm chứng. LLM cũng có thể tạo cảm giác tự tin tương tự.

Vì vậy, hãy tách hai việc: dùng AI để gợi ý và giải thích, còn dùng nguồn đáng tin để xác nhận sự thật.

Ví dụ kỹ thuật đơn giản

Giả sử bạn hỏi: “Cho tôi 3 nguồn chứng minh phương pháp học X tăng điểm 40%.” Nếu context không có tài liệu thật, mô hình có thể tạo tên nghiên cứu nghe rất giống thật. Câu trả lời an toàn hơn nên nói: “Tôi chưa có nguồn xác thực cho con số 40%; cần kiểm tra tài liệu gốc.”

Trong ứng dụng thực tế, nhà phát triển thường giảm hallucination bằng cách đưa tài liệu thật vào context, dùng tìm kiếm web, dùng RAG, hoặc yêu cầu mô hình chỉ trả lời dựa trên nguồn được cung cấp.

Khi nào hallucination nguy hiểm?

Không phải lỗi nào cũng có mức độ giống nhau. Nếu AI bịa một ví dụ vui trong lúc luyện viết, hậu quả thường nhỏ. Nhưng nếu AI bịa liều lượng thuốc, điều khoản pháp lý, số liệu tài chính, lịch thi, chính sách tuyển sinh hoặc đường link thanh toán, hậu quả có thể nghiêm trọng. Càng liên quan đến sức khỏe, tiền bạc, pháp luật, điểm số hoặc dữ liệu cá nhân, càng phải kiểm chứng bằng nguồn chính thức.

Cách kiểm chứng câu trả lời của LLM

Hãy dùng quy trình 4 bước. Bước 1: gạch chân dữ kiện then chốt như tên người, ngày tháng, công thức, số liệu, trích dẫn, link. Bước 2: tìm nguồn gốc, ưu tiên tài liệu chính thức, sách giáo khoa hoặc trang của tổ chức liên quan. Bước 3: so sánh nguồn đáng tin nếu thông tin quan trọng. Bước 4: ghi mức chắc chắn: đã xác nhận, chưa chắc, hoặc cần hỏi giáo viên/chuyên gia.

Một mẹo hay là yêu cầu AI tự đánh dấu phần cần kiểm chứng: “Hãy trả lời, nhưng cuối bài liệt kê các dữ kiện cần kiểm tra lại.”

Cách hỏi để giảm hallucination

Prompt tốt có thể giảm rủi ro. Thay vì hỏi “Hãy viết mọi thứ về chủ đề này”, hãy viết: “Chỉ dựa trên đoạn tài liệu dưới đây, giải thích bằng tiếng Việt dễ hiểu. Nếu tài liệu không nêu, hãy nói là chưa đủ thông tin.” Khi cần nguồn, hãy thêm: “Không tự tạo nguồn.”

Bạn cũng có thể yêu cầu mô hình tách phần “giải thích” và phần “bằng chứng”. Cách tách này giúp bạn tận dụng khả năng diễn giải của LLM mà vẫn giữ thói quen kiểm chứng.

Lỗi hiểu nhầm thường gặp

Hiểu nhầm 1: AI có nguồn tham khảo thì chắc chắn đúng. Không hẳn. Một số nguồn có thể bị bịa, link có thể không tồn tại, hoặc nguồn không nói đúng điều AI đang kết luận.

Hiểu nhầm 2: Chỉ model yếu mới hallucinate. Model tốt thường giảm lỗi, nhưng không model nào nên được tin tuyệt đối trong mọi tình huống.

Hiểu nhầm 3: Kiểm chứng làm mất thời gian nên không cần. Thực tế, kiểm chứng nhanh các dữ kiện quan trọng thường tiết kiệm thời gian hơn nhiều so với sửa hậu quả do dùng sai thông tin.

Bài tập nhỏ

Hãy hỏi một LLM: “Nêu 5 mẹo học tốt môn Toán.” Sau đó chọn một câu có dữ kiện cụ thể, yêu cầu AI đánh dấu phần cần kiểm chứng, rồi tự tìm nguồn đáng tin để xác nhận. Mục tiêu là luyện thói quen phân biệt giữa lời giải thích hữu ích và sự thật cần chứng minh.

Ghi nhớ

Hallucination là khi LLM tạo thông tin sai hoặc không có căn cứ nhưng trình bày rất tự tin. Nguyên nhân đến từ cách mô hình dự đoán ngôn ngữ, context thiếu dữ kiện, dữ liệu nhiễu hoặc câu hỏi mơ hồ. Dùng LLM tốt không có nghĩa là tin mọi câu trả lời; nghĩa là biết tận dụng nó để học nhanh hơn, đồng thời kiểm chứng những dữ kiện quan trọng bằng nguồn đáng tin.