MedQA-CS는 의료 교육의 객관적 구조화된 임상 시험(OSCE)에서 영감을 받아 개발된 AI-SCE 프레임워크로, 대형 언어 모델의 임상 기술을 종합적으로 평가한다.
OLAPH 프레임워크는 비용 효율적이고 다면적인 자동 평가를 활용하여 선호되는 응답을 생성하고 선호 세트를 구축함으로써 언어 모델의 응답에서 허구적 정보를 줄이고 핵심 주장을 포함하도록 최적화한다.
EEG 신호를 활용하여 개인의 감정 상태를 인식하고, 이에 따른 맞춤형 진단 및 치료 계획을 제안하여 자동화된 전자 의료 기록을 생성하는 시스템을 개발하였다.
GMAI-MMBench는 다양한 의료 데이터와 과제, 부서, 지각 세부 수준을 포함하는 포괄적인 의료 AI 평가 벤치마크이다. 이를 통해 현재 의료 AI 모델의 한계를 파악하고 향후 발전 방향을 제시한다.
Lab-AI는 신뢰할 수 있는 건강 정보 소스를 활용하여 환자 맞춤형 정상 범위를 제공함으로써 임상 검사 결과 이해를 높일 수 있다.
Uni-Med는 시각 특징 추출 모듈, 커넥터-MoE 모듈, 그리고 대형 언어 모델로 구성된 새로운 의료 일반화 모델로, 다중 과제 학습에서 발생하는 갈등-시너지 문제를 효과적으로 해결한다.
의료 AI 시스템의 투명성과 사용자 이해도를 높이기 위해서는 설명가능성이 필수적이다. 이 연구에서는 의료 AI에서 '설명'이 무엇인지와 '좋은 설명'의 속성들을 규명하였다.
전문화된 LLM인 Ask Avo는 일반 목적 LLM인 ChatGPT-4에 비해 의사들의 신뢰성, 실행 가능성, 관련성, 포괄성, 사용자 친화성 측면에서 크게 향상된 사용자 경험을 제공한다.
요통 환자 교육을 위한 생성 AI 기술은 아직 임상 적용에 부족한 점이 있다.
대규모 언어 모델은 완화의료 대화의 이해, 공감, 감정, 존재감, 명확성 등의 핵심 지표를 평가하고 향상시킬 수 있다.