本論文は、従来のデータセットでは扱われていない新しい種類のフェイクオーディオ検出に取り組んでいる。従来のデータセットでは、音色、韻律、言語内容、チャンネルノイズなどを変更したフェイクオーディオが主に扱われていた。しかし、本論文では、音声シーンを別のシーンで操作したフェイクオーディオを検出するためのデータセットを提案している。
データセットの構成は以下の通り:
また、本論文では、提案したデータセットに対するいくつかのベースラインモデルの評価実験を行っている。その結果、従来のモデルではシーンフェイクオーディオを十分に検出できないことが示された。
Naar een andere taal
vanuit de broninhoud
arxiv.org
Belangrijkste Inzichten Gedestilleerd Uit
by Jiangyan Yi,... om arxiv.org 04-05-2024
https://arxiv.org/pdf/2211.06073.pdfDiepere vragen