Byte-Pair Encoding (BPE)は記号音楽の分析と生成に適用されているが、音楽と文章の違いから、BPEの振る舞いが異なる可能性がある。本研究では、BPEの振る舞いを楽器編成の違いに着目して分析し、音楽フレーズ分割タスクにおける影響を評価する。
知覚メトリクスを損失関数として使用することで、音楽理解タスクであるジャンル分類の性能が向上する。
日本のアイドルグループの楽曲における歌手の役割分担を正確に記述したコーパス「FruitsMusic」を構築し、歌手ダイアライゼーションなどの音楽情報処理技術の向上に貢献する。
ロボットが人間のメロディーに合わせて適切なコード進行を即座に生成し、リアルタイムに調和的なアコンパニメントを提供することで、人間とロボットが協調してピアノを演奏することができる。
事前学習言語モデルには、プロンプトに対する感度、否定表現のモデル化の困難さ、特定の単語の存在に対する感度といった課題がある。
基礎モデルの急速な進歩に伴い、音楽AIの分野でも新たな研究領域が生まれている。本稿では、モデルアーキテクチャ、説明可能性、生成モデル、評価指標、マルチモーダル性、効率性など、音楽AIの主要な研究課題について概説する。
DOREMUSプロジェクトは、3つのフランスの音楽機関のデータを連携し、ウェブユーザーのニーズに合わせた新しい探索方法を提供することを目的としている。
音楽の熟達度は、音響信号のエントロピーに基づいて測定できる。
ストリーミングTransformerエンコーダーを用いたオンラインでの拍子と強拍の同時トラッキングシステムBEASTを提案し、ベンチマークデータセットで大幅な性能向上を実現した。
大規模な自己教師学習を通じて、音響情報と音楽情報を統合的に学習することで、様々な音楽理解タスクにおいて優れた性能を発揮する汎用的なモデルを提案する。