メインステージ・ダンスミュージックのサブジャンル分類に関する包括的なデータセットと高性能な手法を提供することで、音楽推薦、DJセットのキュレーション、インタラクティブマルチメディアなどの応用シナリオに貢献する。
音楽の感情を理解するためには、リリックスとオーディオの両方を分析する必要がある。
ユーザーの定期的な視聴行動パターンを活用することで、活動駆動型の音楽視聴を効果的にモデル化できる。
クラシック音楽の楽曲カバーを効率的かつスケーラブルに検出するために、和音とメロディに基づくフィンガープリント「CLARAPRINT」を提案する。
Mel スペクトログラムと比較して、Jukebox の深層ベクトル量子化(deep VQ)に基づく音声表現は音楽ジャンル分類に適していないことが示された。