本研究では、PerTokと呼ばれる新しいMIDIエンコーディング手法を提案している。PerTokは、微妙な表現的詳細を捉えつつ、シーケンス長を最大59%、語彙サイズを最大95%まで削減することができる。
Cadenzaフレームワークは2つの段階から構成される:
客観的評価と人間評価の結果から、Cadenzaは他の無条件生成モデルと同等の品質を持ちつつ、より表現的な出力を生成できることが示された。また、入力アイデアに基づいて新しい表現的なバリエーションを作成することができる。
Til et andet sprog
fra kildeindhold
arxiv.org
Vigtigste indsigter udtrukket fra
by Julian Lenz,... kl. arxiv.org 10-04-2024
https://arxiv.org/pdf/2410.02060.pdfDybere Forespørgsler