核心概念
楽譜認識におけるインスタンスセグメンテーションの活用により、楽譜内の楽譜記号の正確な検出と分離が可能となり、より詳細な情報抽出が実現できる。
摘要
本研究は、楽譜認識(OMR)における知識発見を探索するため、Mask R-CNNを用いたインスタンスセグメンテーションの適用を検討している。従来のオブジェクト検出手法では、楽譜内の楽譜記号の密集や重複に起因する課題があったが、インスタンスセグメンテーションによりこれらの問題に対処できる。
具体的には以下の通り:
- DoReMiとMUSCIMA++のデータセットを用いて、オブジェクト検出とインスタンスセグメンテーションの比較評価を行った。
- インスタンスセグメンテーションではMask R-CNNを採用し、ResNet50とResNet101のバックボーンネットワークを検討した。
- 楽譜内の細長い要素である譜線の検出には、従来の画像処理手法を並列に適用した。
- インスタンスセグメンテーションはオブジェクト検出に比べ、楽譜内の密集した記号の正確な分離に優れることが示された。
- 提案手法により、楽譜の詳細な情報抽出が可能となり、楽曲データベースの高度な検索や比較分析などの知識発見に寄与できる。
統計資料
楽譜内の密集した記号に対して、Mask R-CNNを用いたインスタンスセグメンテーションにより、平均精度(mAP)が最大59.70%まで向上した。
オブジェクト検出では、ResNet50ベースのモデルが80.99%のmAPを達成し、既存研究と同等の性能を示した。
引述
"インスタンスセグメンテーションは、楽譜内の重複する記号の正確な分離に優れており、OMRの精度向上に寄与する。"
"提案手法により、楽譜の詳細な情報抽出が可能となり、楽曲データベースの高度な検索や比較分析などの知識発見に貢献できる。"