機械学習モデルの信頼性を向上させるには、入力の不確実性を考慮し、後続のモデルに伝播させていくことが重要である。
医療における電子健康記録を用いた臨床転帰予測において、大規模言語モデル(LLM)の不確実性定量化と低減は、AIヘルスケアの信頼性向上に不可欠である。
戦略的コンフォーマル予測は、機械学習モデルの予測に対して個人が戦略的に行動を変える可能性がある場合でも、信頼性の高い不確実性定量化を実現する新しいフレームワークである。
本論文では、偏微分方程式(PDE)で記述されるモデルにおける、異なる物理ドメイン間での不確実性伝播を効率的に行うための、条件付き正規化フローに基づく新しいドメイン分割不確実性定量化(DDUQ)手法を提案している。
エビデンスディープラーニング(EDL)は計算効率の良さから注目されていますが、モデルの不確実性を考慮していないため、 epistemic uncertainty と aleatoric uncertainty を正確に定量化できない可能性があります。
大規模言語モデルにおける自由形式応答生成の不確実性定量化は、タスク固有の不確実性を識別する必要があり、従来の測定基準では不十分であるため、ベイジアン決定理論の観点から、生成された応答と仮説的な真の応答を比較する類似性尺度によってユーティリティが特徴付けられると仮定することで、モデルの主観的な不確実性とその較正の原則的な定量化が可能になる。
自律システムにおける学習済みモジュールの不確実性尺度は、システム全体の堅牢性に影響を与えるものであり、下流の意思決定アルゴリズムとの関連性において評価する必要がある。
本稿では、決定論的モデルに基づく予測の不確実性定量化手法として、予測中心型不確実性定量化(PCUQ)を提案する。これは、従来の平均データ適合ではなく、予測適合を重視することで、モデルの誤指定に対するロバスト性を高め、より正確な予測分布を得ることを目指す。
従来の質量マッピングにおける不確実性定量化手法は、データ分布の事前知識や特定のモデルに依存しているため、信頼性の高いエラーバーの取得が課題となっている。本論文では、分布フリーな較正手法であるCQRとRCPSを導入し、様々な質量マッピング手法に対して、データ分布に依存しない有限サンプルのカバレッジ保証を提供する。
本稿では、SPECT/CT画像における吸収線量推定の精度向上のため、投影データのポアソンノイズに起因する不確実性を定量化する計算効率の高いアルゴリズムを提案し、検証する。