Grunnleggende konsepter
本研究では、複数の評価者による多様な注釈に対処し、計算リソースの大幅な削減を可能にする新しいプロンプト学習ベースのフレームワークPU-Netを提案する。PU-Netは、個々の評価者の洞察と全体の評価者の合意を同時にモデル化することで、曖昧な医療画像セグメンテーションの包括的な不確実性推定を実現する。
Sammendrag
本研究は、医療画像セグメンテーションにおける2つの主要な課題に取り組んでいる。
- 複数の評価者が多様な注釈を行う場合にどのように深層学習モデルを訓練するか。
- 異なるデータドメインに適用する際に、計算リソースを大幅に削減しつつモデルを効率的に微調整する方法。
提案するPU-Netフレームワークでは、以下の取り組みを行っている:
- 評価者を異なる入力ドメインとして扱い、評価者固有のプロンプトを学習することで、各評価者の独自の洞察を捉える。
- 評価者の合意と不一致を統合するための新しいミックストレーニング戦略を設計する。
- モデル全体の再訓練ではなく、プロンプトのみの微調整を行うことで、計算リソースを大幅に削減する。
実験では、2つの公開データセットを用いて提案手法の有効性を検証した。結果は、PU-Netが曖昧な医療画像セグメンテーションに対して優れた性能を発揮し、計算リソースの大幅な削減にも成功していることを示している。
Statistikk
各評価者の注釈に基づいて訓練したベースラインモデルは、同じ評価者の注釈に対して最高の性能を示す。
多数決ラベルに基づいて評価すると、ベースラインモデルの性能に差がある。これは、評価者間の専門性レベルが異なることを示している。
提案のPU-Net(prompt)は、様々な真のラベルに対して優れた性能を示し、評価者個人の洞察と集合的な洞察をうまくモデル化できていることを示している。
PU-Net(prompt)は、ベースラインモデルと比べて更新パラメータが約0.3%と大幅に少なく、計算リソースの大幅な削減を実現している。