Core Concepts
GPT-4V shows potential but limited effectiveness in interpreting real-world chest radiographs.
Abstract
この記事は、GPT-4 with Vision(GPT-4V)を使用して胸部X線写真の放射線所見を検出する能力に焦点を当てています。実験では、ゼロショット設定とフューショット設定でのパフォーマンスが評価され、結果はICD-10コードやそれらの対応する側面などに関連して報告されました。結果として、GPT-4Vは一定の性能向上を示しましたが、実世界の胸部X線写真の解釈には限界があることが示唆されました。
Introduction:
- 胸部X線写真から放射線所見を生成することが医用画像解析で重要である。
Materials & Methods:
- 100枚の胸部X線写真とレポートが2人の放射線科医と3人のレジデントによって注釈付けされた。
GPT-4 with Vision (GPT-4V):
- 2023年10月13日版のGPT-4V(OpenAI)が使用された。
Experimental setup:
- GPT-4を使用して各自由テキスト放射線レポートを放射線所見表に変換した。
Statistical Analysis:
- Cohen's Kappaスコアでインターレーター間一致度を報告した。
Results:
- ゼロショット設定およびフューショット設定でのパフォーマンスが報告された。
Stats
ゼロショット設定では、NIHデータセットでICD-10コードだけを検出するタスクでは、G&R+/R+は12.3%、F1スコアは7.3%。MIDRCデータセットでは、G&R+/R+は25.0%、F1スコアは18.2%。
フューショット学習では、NIHデータセットでICD-10コードだけを検出するタスクでは、G&R+/R+は12.7%、F1スコアは11.1%。MIDRCデータセットでは、G&R+/R+は35.9%、F1スコアは34.3%。