長文理解には検索と全体理解という2つの主要な能力が存在する。タスクの焦点カテゴリーを知ることなくしては、LLMの長文理解能力の理解と改善は不可能である。DOLCEフレームワークは、ベンチマークから検索重視とホリスティック理解重視のタスクを自動的に識別し、それぞれの難易度を定量的に測定する。