核心概念
大規模言語モデルを使用してCT検査結果を自動評価する新しい方法を提案。
要約
CT検査の増加による放射線科医の負担軽減と、ビジョン言語LLMが生成した内容を容易に評価するための新しい枠組みが提案されています。GPT-4Vなどのモデルが異常所見に関する要約文を生成し、GPT-4がそれらを特定の側面に分解して自動的に評価します。この手法は臨床での使用に向けて重要な洞察を提供し、将来の開発を導くものです。
統計
CT検査件数が年々増加しており、放射線科医の負担が増大している。
GPT-4Vは他のモデルよりも優れた性能を示すが、全体的な改善が必要。
自動化された方法で生成されたスコアは臨床家から得られたスコアと高い相関性(≥ 85%)がある。
引用
"現在、胸部X線写真(CXR)用に報告書生成方法が注目されていますが、CTなど他のモダリティへの取り組みは不足しています。"
"我々はCT画像内に異常(例:病変)を含むスライスをビジョンベースLLM(GPT-4V、LLaVA-Med、RadFM)に入力し、異常性質の予測特徴について自由文要約を生成します。"
"GPT-4Vは評価で他のモデルよりも優れていますが、全体的な改善が依然必要です。"
"GPT-4は臨床家から得られたスコアと高い相関(≥ 85%)を示しました。"