本研究では、音楽タギングタスクにおける自己教師あり学習手法の性能を比較した。5つの手法(対比学習、BYOL、クラスタリング、Barlow Twins、VICReg)を同一のデータセットとモデル構造で評価した。
結果として、対比学習が最も優れた性能を示した。これは、音楽ドメインにおいて対比学習が他の手法に比べて適切な特徴表現を学習できることを示唆している。一方、BYOL、Barlow Twins、VICRegは対比学習や一部のクラスタリングに劣る結果となった。
また、限られたデータ量の状況でも、対比学習が最も良好な性能を発揮することが分かった。これは、自己教師あり学習の有効性を示すものである。
本研究では、オープンソースの事前学習済みモデルも公開しており、音楽情報処理分野の研究者や実務家にとって有用なリソースとなることが期待される。
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Gabriel Mese... a las arxiv.org 04-16-2024
https://arxiv.org/pdf/2404.09177.pdfConsultas más profundas