長文脈モデルは、与えられた文脈に基づいて応答するのではなく、自身の内在的知識に依存する傾向がある。オープンソースの長文脈モデルは、クローズドソースのモデルに比べて引用の正確性と網羅性が大幅に劣っている。
長文理解任務可分為檢索型和整體理解型兩大類。理解和進一步改善大型語言模型的長文理解能力需要知道任務的重點類別。
長文理解には検索と全体理解という2つの主要な能力が存在する。タスクの焦点カテゴリーを知ることなくしては、LLMの長文理解能力の理解と改善は不可能である。DOLCEフレームワークは、ベンチマークから検索重視とホリスティック理解重視のタスクを自動的に識別し、それぞれの難易度を定量的に測定する。