Uni-Medは、視覚特徴抽出モジュール、Connector-MoEモジュール、LLMから構成される医療汎用基盤モデルであり、6つの医療タスクを効率的に実行できる。Connector-MoEモジュールにより、タスク間の干渉を効果的に軽減し、優れた性能を発揮する。
本研究は、大規模言語モデル (LLM) の医療診断における解釈可能性を高めるためのChain of Diagnosis (CoD)を提案する。CoDは診断プロセスを医師の思考過程に沿った診断チェーンに変換し、透明性を確保する。さらに、診断の確信度分布を出力することで、決定の透明性を高める。この解釈可能性により、診断の可制御性が向上し、確信度エントロピーの低減を通じて重要な症状の特定が可能となる。
大規模言語モデルはデリリウムリスクの予測において、医療AIシステムに比べ大幅に劣る性能を示した。大規模言語モデルには複雑な臨床データの解釈と正確な診断を行う能力が不足しており、現時点では医療現場での自律的な意思決定に適していない。
時間切迫の状況において、人間の意思決定者は、状況に応じたAIソフトウェアと相互作用し、多くの差し迫った可能性のあるシナリオを評価し、数十億もの事実を検索し、数兆もの要因に基づいて異なる結果を推定することができる。高次の推論では、「もし~ならば」の質問を使って推論の前提や前提条件を検討し、「なぜ~しないのか」の質問を使って適用された推論方法を検討し、「それで何が」の質問を使って決定の目的を検討し、「どうすれば」の質問を使って方法の適用可能性を検討することができる。これらの高次の推論の質問を人間の意思決定を支援するために適用すれば、人間が時間切迫の状況で適切な決定を下し、偽陰性や偽陽性のエラーを回避することができる。
医療と人工知能の分野で使用されるデータセット用語の不一致を解消し、両分野の研究者間の効果的なコミュニケーションを促進する。
GPT-4 Vision は医療画像理解、医学知識の想起、多様なモダリティを統合した推論において、しばしば不適切な根拠を示すことが明らかになった。
医療分野における人工知能の活用を促進するためには、人工知能の決定プロセスの透明性を高め、人間の意思決定プロセスを補完するデザインアプローチが重要である。
医療分野における基盤モデルは、限られたAIモデルと多様な医療実践の矛盾を打破し、医療AIモデルの発展を促進している。基盤モデルの発展により、より広範な医療シナリオが恩恵を受けることが期待されている。
SUDOは、ラベルのない状況でも人工知能システムの予測の信頼性を特定し、モデルの選択を支援し、アルゴリズムバイアスを評価することができる。
医療分野におけるAIシステムの決定プロセスの透明性を高めることは重要である。注目度マップは、AIの決定に影響を与えた画像の部分を示すが、その信頼性には課題がある。本研究では、注目度マップの不整合性を分析し、医療AIの説明可能性を向上させるための包括的なアプローチを提案する。