核心概念
本文探討使用預期效用(EU)作為評估人工智慧輔助的排除裝置在乳房攝影篩檢中的效用的替代指標,以解決敏感性和特異性指標在回顧性模擬研究中的局限性。
摘要
本文探討了使用預期效用(EU)和陽性/陰性預測值(PPV/NPV)作為評估人工智慧輔助的排除裝置在乳房攝影篩檢中效用的替代指標。
首先,作者回顧了兩種評估指標:
- PPV/NPV:可以解決敏感性和特異性指標在回顧性模擬研究中的局限性,但需要知道所有患者的真實結果。
- EU:基於效用理論,可以使用大型回顧性數據集評估,不需要知道所有患者的真實結果。
接著,作者將這兩種方法應用於兩項最近發表的回顧性模擬研究:
- 美國研究:無論使用PPV/NPV還是EU,都無法證明人工智慧輔助的排除裝置能顯著提高篩檢效果。但EU下降幅度在排除30%患者以內時並不顯著。
- 歐洲研究:由於缺乏歐洲雙重閱讀篩檢的基準EU值,作者估算了一個基準值,並發現即使排除70%患者,EU下降也只有10%左右。
作者認為,PPV/NPV和EU可以更好地解決回顧性模擬研究中敏感性和特異性指標的局限性,為評估人工智慧輔助的排除裝置提供更有力的證據。此外,EU可以僅使用篩檢率和癌症檢出率計算,更加方便。
统计
乳房攝影篩檢中,每年約有4000萬次檢查。
美國研究中,人工智慧單獨的AUROC為0.85。
美國研究中,放射科醫生的敏感性為90.6%,特異性為93.5%。
美國研究中,人工智慧輔助的放射科醫生的敏感性為90.1%,特異性為94.2%,可排除19.3%的病例。
歐洲研究中,人工智慧的AUROC為0.84。
歐洲研究中,標準篩檢的篩檢率為3.2%,癌症檢出率為0.61%。