DocGenomeは、153の学術分野にわたる500Kの科学文書を自動アノテーションし、文書分類、視覚的グラウンディング、レイアウト検出、文書変換、単一ページおよび複数ページのQAなど、多様なタスクをカバーする大規模ベンチマークデータセットである。これにより、マルチモーダル大規模言語モデルの科学文書理解能力を包括的に評価できる。