מושגי ליבה
本研究は、医療画像分類タスクにおいて、潜在変数誘導型拡散モデルと入れ子型アンサンブルを組み合わせることで、従来手法よりも高い予測精度と確信度を実現する。
תקציר
本研究は、医療画像分類の頑健性と信頼性を向上させるための新しい手法を提案している。
主な内容は以下の通り:
提案手法LaDiNEは、トランスフォーマーエンコーダーとマッピングネットワークを用いて、入力画像から不変で有意義な潜在変数を抽出する。
抽出した潜在変数を条件として、柔軟な分布推定が可能な拡散モデルを用いて、各アンサンブルメンバーの予測分布を推定する。
複数のアンサンブルメンバーから得られた予測分布を平均化することで、最終的な予測を行う。
実験では、結核胸部X線画像と皮膚がん画像の分類タスクを対象に、ノイズ、解像度低下、コントラスト変化、敵対的攻撃などの様々な分布シフトに対する頑健性を評価した。
提案手法LaDiNEは、従来手法と比較して、高い予測精度と適切な確信度を示し、医療現場での信頼性の高い利用が期待できる。
סטטיסטיקה
結核胸部X線画像データセットでは、ノイズ付加時(ð = 1.00)の精度が50%に低下するが、LaDiNEは57.76%を維持している。
皮膚がん画像データセットでは、低コントラスト時(r = 0.70)の精度がLaDiNEは93.14%と最高値を示している。
ציטוטים
"従来の深層学習モデルは、入力画像の分布変化に対して脆弱であり、医療現場での信頼性の高い利用が課題となっている。"
"提案手法LaDiNEは、潜在変数の抽出と柔軟な分布推定により、様々な分布シフトに対して高い頑健性を示した。"