核心概念
500万件を超える節足動物の標本画像、DNAバーコード、分類学的情報を統合した大規模マルチモーダルデータセット「BIOSCAN-5M」とそのベンチマークタスクを紹介し、生物多様性理解と保全のための機械学習研究を促進する。
要約
BIOSCAN-5M:昆虫の生物多様性に関するマルチモーダルデータセット
Gharaee, Z., Lowe, S.C., Gong, Z. et al. BIOSCAN-5M: A Multimodal Dataset for Insect Biodiversity. Preprint at arXiv:2406.12723v4 (2024).
本研究は、昆虫の生物多様性を理解し、監視するための新しいマルチモーダルデータセットであるBIOSCAN-5Mを機械学習コミュニティに紹介し、いくつかのベンチマークタスクを確立することを目的とする。