本研究では、乳がん検診におけるAI支援除外デバイスの性能評価に、PPV/NPVおよびEUを適用した。
PPV/NPVは、デバイス使用時の感度低下と特異度上昇の相反関係を解決できる指標である。しかし、非recalled患者の真の状態が分からないため、PPV/NPVを算出するのが困難な場合がある。
EUは、感度と特異度のトレードオフを考慮した単一の性能指標であり、recalled患者と非recalled患者の情報から算出できる。EUを用いることで、デバイス使用時の性能変化を定量的に評価できる。
米国の研究では、デバイス使用時のEUは有意な改善を示さなかった。一方、欧州の研究では、デバイスによる除外率が高くなるほどEUが低下する傾向がみられたが、30%以下の除外率では性能低下は小さかった。
このように、retrospective studyにおいては感度・特異度よりもPPV/NPVやEUが適切な指標となり、デバイスの性能評価に有用である。
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問