本記事は、ChatGPTの新機能である画像解析を用いた皮膚がん診断の性能評価について報告したものです。
研究では、100件の皮膚病変(メラノーマ50件、良性母斑50件)のデルマトスコピー画像をChatGPTに提示し、最も可能性の高い診断名を出力させました。その結果、ChatGPTの感度は32%、特異度は40%、全体の診断精度は36%と、承認済みのAI診断アルゴリズムと比べて大幅に低い性能でした。
また、ChatGPTが提示した上位3つの診断名に正解が含まれる割合は56%にとどまりました。悪性と良性の鑑別についても、感度78%、特異度47%と、臨床使用には課題が残る結果でした。
本研究は症例数が少なく、病変の部位や厚さなどの重要情報を考慮していないという限界はありますが、現時点のChatGPTでは皮膚がん診断に十分な精度が得られないことが示されました。今後の技術的な進歩に期待がかかりますが、現状では臨床現場での使用は難しいと考えられます。
To Another Language
from source content
www.medscape.com
Key Insights Distilled From
by Marie-Line B... at www.medscape.com 07-10-2024
https://www.medscape.com/viewarticle/tell-me-chatgpt-this-melanoma-2024a1000co7Deeper Inquiries