本論文では、ニューラルオーディオウォーターマーキングの課題に取り組むため、IDEAW (Invertible Dual-Embedding Audio Watermarking) モデルを提案している。
まず、ウォーターマークメッセージとロケーションコードを別々にエンベディングする2段階の可逆ニューラルネットワーク (INN) を設計した。これにより、ロケーションコードの抽出に要する計算コストを大幅に削減できる。
次に、攻撃層の導入によって生じる非対称性の問題に対処するため、バランスブロックを導入した。これにより、INNの対称性を維持しつつ、攻撃に対する堅牢性を高めることができる。
実験の結果、提案手法であるIDEAWは、既存手法と比較して高い容量と効率的なロケーション能力を持ちながら、様々な攻撃に対する堅牢性も高いことが示された。
Vers une autre langue
à partir du contenu source
arxiv.org
Questions plus approfondies