Công tác quản trị bệnh viện ở Việt Nam vận hành trên những tình huống không bao giờ lọt vào một bộ dữ liệu nào. Một khoa quá tải vượt công suất ngay giữa lúc ngân sách bị siết, trong khi một quy định mới của Bộ Y tế lại thay đổi những việc nhân viên được phép làm. Đó chính là lúc các quyết định hành chính trở nên khó khăn, và cũng chính là điều mà dữ liệu lâm sàng thật không thể phản ánh được. Hồ sơ người bệnh và bảng phân công nhân sự chứa thông tin riêng tư nên luôn bị giữ kín. Lối suy luận mà người làm quản trị bệnh viện phải thực hiện mỗi ngày gần như không có tài liệu huấn luyện công khai nào đứng phía sau.
Meddies/meddies-scenarios là nỗ lực của chúng tôi nhằm thu hẹp khoảng trống đó bằng dữ liệu tổng hợp thay cho hồ sơ thật. Đây là một bộ khoảng 99.000 tình huống quản trị bệnh viện bằng tiếng Việt, do nhóm Meddies Research xây dựng và công bố trên Hugging Face. Chúng tôi gắn nhãn nó là Domain H, viết tắt cho quản trị bệnh viện (hospital administration), đánh dấu đây là một mảng trong một nỗ lực lớn hơn về trí tuệ nhân tạo lâm sàng. Mỗi dòng dữ liệu là một tình huống được viết bằng tiếng Việt, để một mô hình có thể đọc, suy luận và phản hồi.
Vì sao dữ liệu thật không làm được việc này
Nguồn dữ liệu huấn luyện hành chính hiển nhiên nhất chính là bản thân bệnh viện. Nhưng đó cũng là nguồn mà chúng tôi không thể dùng. Hồ sơ vận hành nêu đích danh con người, cơ sở và các quyết định cụ thể; công bố chúng đồng nghĩa với việc phơi bày người bệnh và nhân viên. Vẫn có những lựa chọn thay thế đã được dịch sang ngôn ngữ khác hoặc không phụ thuộc ngôn ngữ, nhưng chúng đánh mất phần quan trọng nhất. Một ràng buộc ngân sách diễn đạt bằng tiếng Anh, trong một hệ thống y tế chung chung, không mang theo áp lực thể chế vốn định hình một quyết định bên trong một bệnh viện công Việt Nam. Chúng tôi muốn những tình huống đọc lên giống như thật mà không được dựng nên từ dữ liệu thật của bất kỳ ai. Tạo dữ liệu tổng hợp là con đường để có được cả hai điều đó.
Dựng một tình huống thành bài toán có cấu trúc
Quyết định thiết kế nằm dưới toàn bộ bộ dữ liệu là: một tình huống hành chính không phải là một đoạn văn. Nó là một bài toán gồm nhiều phần, và các phần đó phải tách rời được thì mô hình mới suy luận được trên chúng. Vì vậy chúng tôi cho mỗi dòng cùng một bộ khung, gồm hai mươi tư trường, được nhóm lại sao cho mỗi nhóm trả lời một câu hỏi về tình huống.
Trước hết, chuyện này diễn ra ở đâu. Mỗi tình huống được neo vào một loại cơ sở và một địa điểm, một bệnh viện tuyến huyện, một phòng khám tư, hay một bệnh viện tuyến cuối ở một vùng được nêu tên, rồi thu hẹp xuống một khoa hoặc một đơn vị cụ thể bên trong đó. Bối cảnh đặt trước diễn biến là có chủ đích. Cùng một vấn đề sẽ đọc lên rất khác trong một đơn vị tuyến huyện nhỏ so với trong một bệnh viện tuyến trên lớn, và mô hình nên thấy sự khác biệt đó trước khi thấy các sự kiện.
Tiếp theo, chuyện gì đang diễn ra. Phần mô tả diễn biến của mỗi dòng ghi lại sự kiện châm ngòi cho tình huống, dòng thời gian, hiện trạng, và hướng giải quyết mà nhân viên đang hướng tới. Chúng tôi tách situation_triggering_event khỏi situation_desired_outcome để nguyên nhân và mục tiêu vẫn tách bạch. Khi đó mô hình có thể được yêu cầu bắc cầu giữa hai phần, thay vì phải đoán cả hai từ một khối văn bản chung.
Phần thiết kế khó nhất dồn vào những áp lực khiến các bài toán này trở nên thật. Quyết định hành chính hiếm khi khó vì người ta không biết đâu là đáp án đúng. Chúng khó vì tiền bạc, nhân lực, quy định, thời gian và chính trị nội bộ cùng dồn ép một lúc. Chúng tôi mã hóa những áp lực đó thành các trường riêng, trong đó ràng buộc pháp quy có thể tham chiếu chính sách của Bộ Y tế, còn ràng buộc chính trị phản ánh những động lực thường gặp trong y tế công Việt Nam. Một tình huống không có ràng buộc chỉ là một bài tập lập kế hoạch. Một tình huống có các ràng buộc xung đột với nhau mới chính là công việc thực sự.
Bảng dưới đây nhóm bộ khung theo câu hỏi mà mỗi phần trả lời.
| Câu hỏi nhóm này trả lời | Phần đó nắm bắt điều gì trong dòng dữ liệu |
|---|---|
| Chuyện này diễn ra ở đâu | Loại cơ sở và địa điểm (bệnh viện tuyến huyện, phòng khám tư, bệnh viện tuyến cuối ở một vùng được nêu tên), thu hẹp xuống một khoa hoặc đơn vị cụ thể |
| Chuyện gì đang diễn ra | Phần mô tả diễn biến: sự kiện châm ngòi cho tình huống, dòng thời gian, hiện trạng và hướng giải quyết mà nhân viên đang hướng tới, với situation_triggering_event được tách khỏi situation_desired_outcome |
| Điều gì khiến nó khó | Các áp lực được mã hóa thành những trường riêng: tiền bạc, nhân lực, quy định, thời gian, chính trị nội bộ, trong đó ràng buộc pháp quy có thể tham chiếu chính sách của Bộ Y tế và ràng buộc chính trị phản ánh động lực của y tế công Việt Nam |
| Nó đến từ đâu | Nguồn gốc: mô hình ngôn ngữ nào đã tạo ra dòng dữ liệu và mức độ khó của nó |
Mỗi dòng mang theo nguồn gốc của chính nó. Chúng tôi ghi lại mô hình ngôn ngữ nào đã tạo ra nó và chấm mức độ khó, để bộ dữ liệu có thể minh bạch về xuất xứ của mình và về mức độ khó mà mỗi ca được thiết kế hướng tới.
Bản công bố này là gì, và để làm gì
Dữ liệu được kiểm soát truy cập chứ không mở hoàn toàn. Trang giới thiệu trên Hugging Face thì công khai, nhưng để tải các tệp về cần có tài khoản Hugging Face và phải chấp nhận các điều kiện truy cập, dù bạn kéo về qua thư viện datasets hay tải trực tiếp từng tệp. Giấy phép là Creative Commons Attribution 4.0 International, CC-BY-4.0, không kèm hạn chế phi thương mại. Bạn có thể sử dụng, chia sẻ và chỉnh sửa các tình huống cho bất kỳ mục đích nào, kể cả mục đích thương mại, miễn là ghi nhận nguồn.
Chúng tôi xây dựng bộ dữ liệu với ba mục đích sử dụng trong đầu. Bảng dưới đây trình bày từng mục đích cùng với đặc tính của dữ liệu mà nó dựa vào.
| Mục đích sử dụng | Nó dựa trên điều gì |
|---|---|
| Làm hạt giống để tạo thêm dữ liệu tổng hợp | Một mô hình được huấn luyện hoặc được nhắc trên các dòng này sẽ học được cấu trúc và từ vựng của quy trình làm việc trong bệnh viện Việt Nam mà không hề chạm tới một hồ sơ người bệnh hay nhân viên thật nào |
| Làm ca kiểm thử cho các hệ thống tư vấn vận hành, nhân sự hay ngân sách | Một dải đủ rộng các mức độ khẩn cấp và loại ràng buộc để thử thách một hệ thống |
| Đo lường năng lực suy luận hành chính | Cấu trúc trường biến mỗi dòng thành một đề bài, nhờ đó có thể đo được khả năng của mô hình trong việc tìm ra các ràng buộc liên quan, suy luận hướng tới kết quả mong muốn và đề xuất các bước tiếp theo; mức độ khó cho phép việc đánh giá tách theo từng bậc phức tạp thay vì gộp chung thành một mớ không phân biệt |
Mức độ khó chính là thứ giữ cho mục đích thứ ba không sụp về một con số trung bình. Một hệ thống xử lý tốt bậc dễ nhưng thất bại ở bậc khó sẽ trông y hệt một hệ thống trung bình khi chỉ nhìn vào một điểm số gộp chung. Tách theo từng bậc sẽ phân biệt được hai trường hợp đó.
Những giới hạn cần nói thẳng
Đây là dữ liệu tổng hợp, và chúng tôi không khẳng định nó khớp với kết cấu thật của vận hành bệnh viện, cũng không khẳng định rằng bất kỳ hệ thống nào huấn luyện trên nó sẽ hoạt động tốt trong môi trường lâm sàng. Các tình huống được tạo ra bởi mô hình ngôn ngữ, nên chúng thừa hưởng mọi thiên lệch mà các mô hình đó nghiêng về, còn các mức độ khó thì phản ánh chủ đích thiết kế của chúng tôi chứ không phải một kết quả đã đo được. Điều bản công bố này mang lại là một điểm khởi đầu có cấu trúc, bằng tiếng Việt, chỉ yêu cầu ghi nhận nguồn, cho bài toán suy luận hành chính ở một nơi vốn chưa từng có gì. Câu hỏi tiếp theo là liệu những tình huống có hình hài như thế này có chuyển giao được sang công việc hành chính thật hay không, và đó chính là điều chúng tôi muốn tìm ra.
Bộ dữ liệu nằm tại huggingface.co/datasets/Meddies/meddies-scenarios.
