CoD(Chain of Diagnosis)는 LLM(Large Language Model)의 진단 과정을 의사의 사고 과정을 반영하는 진단 체인으로 변환하여 해석 가능성을 높이고, 진단 결과의 신뢰성과 제어 가능성을 보장한다.
본 연구는 외부 지식 그래프에서 관련 지식을 검색하고 이를 프롬프트 템플릿에 인코딩하여 언어 모델의 이해와 추론 능력을 향상시키는 지식 강화 질병 진단 방법을 제안한다.
HALO는 대화형 언어 모델의 정확성과 신뢰성을 높이기 위해 환각 탐지 및 완화에 초점을 맞춘 새로운 프레임워크이다.
의료 분야에서 활용되는 대규모 언어 모델(LLM)의 성능을 다각도로 평가하기 위한 MEDIC 프레임워크를 소개한다. MEDIC은 의료 추론, 윤리 및 편향, 데이터 및 언어 이해, 상황 학습, 임상 안전 및 위험 평가 등 5가지 핵심 차원에서 LLM의 역량을 종합적으로 평가한다.
반복적인 후속 질문을 통해 대형 언어 모델의 의료 질문 답변 성능을 향상시킬 수 있다.
AI 기반 의료 기기의 실제 사용 환경에서의 성능 유지를 위해 반복적인 검증과 미세 조정이 필요하다.
시간이 촉박한 상황에서 인공지능 기반 상황 인식 소프트웨어와 의사결정자가 상호작용하여 수많은 임박한 시나리오와 가능한 시나리오를 평가하고, 수조 개의 매개변수를 기반으로 다양한 결과를 추정할 수 있다.
ChatGPT 3.5와 4.0 버전의 외래 진료 안내 응답 일관성을 평가하여 의료 현장에서의 활용 가능성을 탐색하였다.
의료와 인공지능 분야의 데이터셋 용어 간 혼란을 해소하고 명확한 의사소통을 위한 표준화된 용어 사용의 필요성
Hippocrates는 의료 분야에서 대규모 언어 모델의 성능을 향상시키기 위한 오픈 소스 프레임워크이다. 데이터, 코드, 모델 체크포인트, 평가 프로토콜 등을 공개하여 의료 AI 연구의 발전을 도모한다.