提案されたM3AVデータセットは、高品質な人間注釈を備えた新しい多様な学術講義データセットであり、音声認識やスライド生成などの多くのタスクに活用可能です。
Proposing the M3AV dataset for multimodal academic content recognition and understanding tasks.