本稿では、解決不可能な問題のデータセットを用いて、大規模言語モデル(LLM)が不確実性を認識できるかどうかを評価する新しい枠組みを提案しています。真の知能は自身の限界を認識できる能力と関連しているという考えに基づき、LLMが「わからない」と回答できるかどうかを評価します。