Quay lại Bài viết
May 29, 2026Giải thích5 phút đọc

Sai sót nguy hiểm nhất của bản tóm tắt bệnh án AI không phải là bịa đặt, mà là bỏ sót

Một dữ kiện bịa ra thì bác sĩ còn truy ngược về bệnh án để bắt được; một chống chỉ định bị lặng lẽ bỏ sót thì không để lại dấu vết nào. Đó mới là kiểu sai nguy hiểm hơn, và cũng là kiểu ít được kiểm tra nhất.

Meddies Research

Clinical AI research at Meddies

Sai sót nguy hiểm nhất của bản tóm tắt bệnh án AI không phải là bịa đặt, mà là bỏ sót

Sai sót nguy hiểm nhất trong một bản tóm tắt bệnh án do AI tạo ra không phải là một dữ kiện bịa đặt. Nó là một dữ kiện có thật nhưng không bao giờ được nhắc đến.

Khi bản tóm tắt bịa ra điều gì đó, bác sĩ có thể bắt được bằng cách đối chiếu với bệnh án. Nhưng khi bản tóm tắt lặng lẽ bỏ qua một chống chỉ định hay một kết quả xét nghiệm bất thường, bản tóm tắt vẫn đọc như thể đã đầy đủ, không có chỗ nào trông ra sai, và chỗ bỏ sót cứ thế trôi đi mà không ai chất vấn. Chính sự bất đối xứng đó mới là toàn bộ vấn đề, vậy mà phần lớn sự chú ý lại đổ dồn vào nửa sai.

Bịa đặt thì tự lộ ra, còn bỏ sót thì ẩn mình

Bịa đặt, theo đúng định nghĩa, là thứ nhìn thấy được. Nếu bản tóm tắt ghi một loại thuốc mà người bệnh chưa từng dùng, ta có thể truy nguồn cho khẳng định đó. Nó hoặc có trong bệnh án, hoặc không. Một bác sĩ nghi ngờ điều gì sẽ đọc lại. Một bước kiểm tra nguồn (grounding check) có thể tự động gắn cờ nó.

Bỏ sót thì không để lại dấu vết nào để lần theo. Bản tóm tắt vẫn nhất quán trong nội tại của nó. Những câu chữ có mặt đều chính xác. Chỉ là không có lấy một câu nào về tiền sử dị ứng penicillin, về creatinine đang có xu hướng tăng, hay về loại thuốc thứ hai vừa được thêm vào hai ngày trước. Người đọc không hề có một tín hiệu nào báo rằng có thứ gì đó đang thiếu.

Điều này có ý nghĩa lâm sàng vì hai kiểu sai này đẩy theo hai hướng ngược nhau. Bịa đặt gieo nghi ngờ. Bỏ sót gieo một sự tự tin sai lầm. Cái thứ nhất làm bác sĩ chậm lại; cái thứ hai đẩy bác sĩ lướt qua đúng chỗ lẽ ra phải dừng.

Một nghiên cứu năm 2025 đăng trên npj Digital Medicine, "A framework to assess clinical safety and hallucination rates of LLMs for medical text summarisation" (Asgari và cộng sự), xem bỏ sót là một lớp lỗi riêng biệt, có liên quan đến an toàn, đứng ngang hàng với bịa đặt trong bài toán tóm tắt văn bản lâm sàng bằng LLM. Hai kiểu sai này không tương đương nhau, và bỏ sót xứng đáng được soi xét riêng. Trên thực tế, nó lại là kiểu sai ít được kiểm tra hơn, đơn giản vì nó khó đo lường hơn.

Vì sao sự chú ý lại nghiêng về phía bịa đặt

Từ "hallucination" (bịa đặt) đi vào ngôn ngữ thường ngày trước. Đó là một khái niệm sinh động, dễ giải thích, và nó ăn khớp với cách con người vốn đã hoài nghi các hệ thống tự động. Lo ngại về việc AI bịa chuyện là một phản ứng theo trực giác.

Bỏ sót thì đi ngược lại trực giác. Người ta không tự nhiên mà nghi ngờ một bản tóm tắt vì những gì nó không nói ra. Mặc định trong nhận thức của ta là đọc một bản tóm tắt như một mẫu đại diện cho tài liệu gốc. Nếu nó trôi chảy và những dữ kiện nó nêu đều chính xác, thì nó đọc như một bản đáng tin.

Chính cái mặc định đó là cơ chế gây ra sai sót. Bản tóm tắt không hề trông thiếu sót. Nó trông như đã hoàn chỉnh.

Bộ kiểm tra chỉ soi những gì được viết ra, không soi những gì còn thiếu

Đây là một vấn đề mang tính cấu trúc, không phải vấn đề kỹ thuật. Một bộ kiểm tra nguồn (grounding verifier) hoạt động bằng cách xác minh xem các khẳng định trong bản tóm tắt có được tài liệu gốc làm căn cứ hay không. Với mỗi câu trong bản tóm tắt, nó hỏi liệu bệnh án có củng cố cho câu đó không. Nếu câu trả lời là không, câu đó bị gắn cờ.

Nhưng một bộ kiểm tra chỉ có thể đánh giá những câu đang tồn tại. Nếu bản tóm tắt chưa bao giờ nhắc đến một dữ kiện nào đó, thì không có câu nào để mà kiểm tra. Bộ kiểm tra không thấy gì sai vì chẳng có gì để nó đánh giá. Ta không thể kiểm tra một câu chưa từng được viết ra.

Vậy nên bỏ sót có một điểm mù trong khâu kiểm chứng mà bịa đặt thì không. Người ta có thể dựng một pipeline để bắt các trường hợp bịa đặt với độ tin cậy chấp nhận được. Còn các trường hợp bỏ sót, theo đúng cách nó hình thành, sẽ lọt qua chính pipeline ấy. Bước kiểm tra xác nhận tính chính xác. Nó không thể xác nhận tính đầy đủ.

Tính đầy đủ đòi hỏi một câu hỏi khác. Không phải "những gì bản tóm tắt nói có đúng không?" mà là "bản tóm tắt có bao quát những gì thực sự quan trọng với người bệnh này không?" Câu hỏi thứ hai khó tự động hóa hơn nhiều, và nó mới là câu quyết định liệu một bản tóm tắt có an toàn để dựa vào đó mà ra quyết định hay không.

Những chỗ bỏ sót mang sức nặng lâm sàng

Không phải thông tin nào bị thiếu cũng như nhau. Một dòng ghi chú về chế độ ăn bị thiếu khác hẳn một tiền sử dị ứng bị thiếu. Rủi ro lâm sàng phân bố không đều khắp bệnh án, và nó dồn lại ở một vài mục.

Những lỗ hổng có rủi ro cao thường nằm ở danh mục thuốc, đặc biệt là các thuốc mới được thêm vào và các lần thay đổi liều; ở phần ghi nhận dị ứng và phản ứng có hại; ở các vấn đề đang hoạt động có liên quan đến lần khám hiện tại; ở phần đánh giá và kế hoạch điều trị, nơi chứa đựng lập luận lâm sàng; và ở các trị số xét nghiệm bất thường hoặc đang có xu hướng biến động. Các mục này có chung một đặc điểm. Một bác sĩ bỏ sót điều gì đó trong những mục này có thể hành động dựa trên chỗ thiếu đó, và tổn hại kéo theo sau là cụ thể chứ không phải lý thuyết.

Một bản tóm tắt ghi đúng phần hành chính và tiền sử nhưng bỏ rơi một chống chỉ định khỏi danh mục thuốc thì không phải là một bản tóm tắt "gần như đúng". Nó là một bản tóm tắt có một rủi ro lâm sàng nằm cài ngay trong chính những gì nó đã bỏ qua.

Hãy đọc nó như một bản nháp, rồi đối chiếu với bệnh án

Mô hình an toàn nhất là coi bản tóm tắt do AI tạo ra như một bản nháp khởi đầu, chứ không phải một bản ghi nhận sau cùng. Bản tóm tắt thu hẹp lại những gì cần rà soát. Nó không thay thế việc rà soát.

Trên thực tế, bác sĩ đối chiếu các mục có rủi ro cao với bệnh án thật, chứ không phải với bản tóm tắt. Nếu bản tóm tắt có nhắc đến một loại thuốc, thì bệnh án mới là nguồn xác thực cho liều hiện tại, ngày bắt đầu dùng và đặc tính tương tác của thuốc đó. Nếu bản tóm tắt ghi "không có tiền sử dị ứng đã biết", khẳng định đó vẫn phải được kiểm tra trực tiếp.

Cách làm này kém hiệu quả hơn so với giao phó hoàn toàn cho bản tóm tắt, và chính sự đánh đổi hiệu quả ấy mới là điều cốt lõi. Chi phí cho một lần kiểm tra thêm ở một mục rủi ro cao là thấp. Còn cái giá phải trả khi hành động dựa trên một chỗ bỏ sót không bị phát hiện thì không hề thấp.

Khả năng truy nguồn làm giảm trở lực này. Khi mỗi dòng trong bản tóm tắt đều dẫn ngược về đúng mục của bệnh án mà nó được rút ra, bác sĩ chuyển từ bản tóm tắt sang nguồn gốc chỉ trong một bước. Bản tóm tắt trở thành một cách để đọc bệnh án nhanh hơn, chứ không phải một thứ thay thế cho việc đọc bệnh án.

Meddies được thiết kế để làm gì

Mỗi dòng trong một bản tóm tắt của Meddies đều mang theo một tham chiếu nguồn, để bác sĩ có thể truy ngược thẳng về bệnh án. Bản tóm tắt được đối xử như một bản nháp để xác nhận, chứ không phải một tài liệu để tin tưởng mà bỏ qua rà soát. Chủ đích thiết kế là kéo sự chú ý về phía các mục có rủi ro cao — thuốc, dị ứng, cùng phần đánh giá và kế hoạch điều trị — bởi đó chính là những nơi mà một chỗ bỏ sót không bị phát hiện dễ gây hậu quả nhất.

Điều này không tự nhận là sẽ loại bỏ được mọi chỗ bỏ sót. Không một phương pháp tóm tắt nào có thể trung thực mà tuyên bố như vậy. Thứ nó làm được là hạ thấp cái giá phải trả để bắt được một chỗ bỏ sót khi nó tồn tại.

Nguyên tắc nền tảng thì đơn giản. Tính đầy đủ là một thuộc tính của bệnh án. Bản tóm tắt chỉ là một con trỏ chỉ về bệnh án. Hãy giữ cho con trỏ ấy luôn hiện hữu, dùng bệnh án để xác nhận những gì quan trọng, và bản tóm tắt sẽ thôi là nơi mà một dữ kiện có thể lặng lẽ biến mất.