核心概念
MDCTCodecは、高サンプリングレートと低ビットレートのシナリオ向けに設計された、効率的で軽量なエンドツーエンドのニューラルオーディオコーデックであり、高品質なオーディオを維持しながら、従来のコーデックよりも高速なトレーニングと生成を実現する。
要約
MDCTCodec: 高サンプリングレート・低ビットレートシナリオに対応する、軽量MDCTベースニューラルオーディオコーデック
Xiao-Hang Jiang, Yang Ai∗, Rui-Chen Zheng, Hui-Peng Du, Ye-Xin Lu, Zhen-Hua Ling. (2024). MDCTCODEC: A LIGHTWEIGHT MDCT-BASED NEURAL AUDIO CODEC TOWARDS HIGH SAMPLING RATE AND LOW BITRATE SCENARIOS.
本研究は、高サンプリングレートと低ビットレートのシナリオにおいて、高品質なオーディオ符号化を実現する、効率的で軽量なエンドツーエンドのニューラルオーディオコーデックを開発することを目的とする。