Quay lại Nghiên cứu
May 8, 2026Phương pháp4 phút đọc

An toàn riêng tư ngay từ thiết kế: vì sao chúng tôi không khử nhận dạng dữ liệu

Thay vì gỡ thông tin riêng tư khỏi bệnh án thật sau khi đã thu thập, chúng tôi không bao giờ đưa nó vào ngay từ đầu. Đó là khác biệt giữa an toàn riêng tư nhờ dọn dẹp và an toàn riêng tư ngay từ thiết kế.

Meddies Research

Clinical AI research at Meddies

An toàn riêng tư ngay từ thiết kế: vì sao chúng tôi không khử nhận dạng dữ liệu

Dữ liệu hội thoại lâm sàng tốt nhất lẽ ra phải là bản ghi thật giữa bác sĩ và người bệnh. Nhưng bạn không được phép dùng chúng. Bệnh án mang theo thông tin cá nhân được pháp luật bảo vệ, và việc luật đóng kín chúng là điều đúng đắn. Hệ quả là các kỹ sư có trong tay những thuật toán đủ mạnh nhưng lại chẳng có dữ liệu hội thoại nào để huấn luyện.

Lối vượt rào sai lầm

Cách làm quen thuộc là thu thập bất cứ thứ gì vương vãi sẵn đó rồi gột rửa thông tin về sau. Khử nhận dạng là việc khó, không bao giờ làm được trọn vẹn, và chỉ cần sót một chi tiết là đủ để nhận diện lại một người bệnh. Dựng một chương trình bảo mật trên nền bệnh án thật nghĩa là mãi mãi phải đi chứng minh một điều không xảy ra: rằng không có gì nhạy cảm bị rò rỉ.

Chúng tôi chọn con đường ngược lại. Thay vì gỡ thông tin riêng tư ra sau khi đã có, chúng tôi không bao giờ đưa nó vào ngay từ đầu.

Tổng hợp, nhưng có kỷ luật

meddies-consultant được sinh ra hoàn toàn bằng các mô hình suy luận, từ con số không. Mỗi nhân vật, mỗi triệu chứng, mỗi lượt đối thoại đều là dữ liệu tổng hợp. Không có người bệnh thật nào đứng sau bất kỳ bản ghi nào, nên không có gì để khử nhận dạng và cũng không có gì để rò rỉ.

Điều đó không có nghĩa là dữ liệu lỏng lẻo. Sinh dữ liệu tổng hợp một cách cẩu thả sẽ cho ra thứ trôi chảy mà vô nghĩa: ba phải, nông về chuyên môn, sai về cấu trúc. Chúng tôi tránh điều đó bằng cách nhốt bộ sinh dữ liệu bên trong các khung lâm sàng và một cổng rà soát lọc theo tiêu chí an toàn lâm sàng. Khả năng kiểm soát độ chính xác mà chúng tôi có được chính là cái lợi của hướng tổng hợp. Còn bảo đảm về quyền riêng tư là cái nền mà tất cả đứng lên trên đó.

"Ngay từ thiết kế" mang lại điều gì

An toàn riêng tư ngay từ thiết kế mạnh hơn an toàn riêng tư nhờ dọn dẹp. Một quy trình dọn dẹp chỉ tốt ngang với lần bỏ sót tệ nhất của nó. Một thiết kế không bao giờ chạm vào dữ liệu thật thì không có gì để bỏ sót.

Với các bệnh viện Việt Nam, nơi việc xử lý dữ liệu người bệnh vừa là nghĩa vụ pháp lý vừa là câu chuyện niềm tin, khác biệt đó là quan trọng. Tập dữ liệu dùng để huấn luyện mô hình có thể được mở ra, soi xét và chia sẻ mà không đặt một người bệnh thật nào vào rủi ro. Đó mới là điều cốt lõi.