核心概念
MAIRA-1은 흉부 X선 영상으로부터 방사선 보고서의 소견 부분을 생성하는 고성능 다중 모달 모델이다.
要約
이 기술 보고서는 MAIRA-1이라는 방사선 전문 다중 모달 모델을 소개한다. MAIRA-1은 사전 훈련된 비전 인코더(RAD-DINO)와 언어 모델(Vicuna-7B)을 활용하여 흉부 X선 영상으로부터 방사선 보고서의 소견 부분을 생성한다.
- 기존 일반 도메인 모델들은 방사선 보고서 생성에 실패하지만, MAIRA-1은 다양한 평가 지표에서 최신 기술 수준을 능가한다.
- MAIRA-1의 성능 향상을 위해 도메인 특화 이미지 인코더, 더 큰 어댑터 모듈, GPT 데이터 증강 등의 기술적 개선이 적용되었다.
- 생성된 보고서 예시를 통해 MAIRA-1의 장단점을 확인할 수 있다. 환자의 과거 기록이나 다른 영상 정보 등 추가 입력이 제공된다면 더 나은 성능을 보일 것으로 기대된다.
統計
정상 사례의 경우 보고서가 더 공식적이어서 어휘 지표가 더 높게 나타난다.
검사 적응증이 제공된 경우 MAIRA-1의 성능이 크게 향상된다. 적응증을 활용하여 보고서에 포함해야 할 긍정/부정 소견을 더 잘 파악할 수 있다.