本論文は、従来のデータセットでは扱われていない新しい種類のフェイクオーディオ検出に取り組んでいる。従来のデータセットでは、音色、韻律、言語内容、チャンネルノイズなどを変更したフェイクオーディオが主に扱われていた。しかし、本論文では、音声シーンを別のシーンで操作したフェイクオーディオを検出するためのデータセットを提案している。
データセットの構成は以下の通り:
また、本論文では、提案したデータセットに対するいくつかのベースラインモデルの評価実験を行っている。その結果、従来のモデルではシーンフェイクオーディオを十分に検出できないことが示された。
Para outro idioma
do conteúdo fonte
arxiv.org
Principais Insights Extraídos De
by Jiangyan Yi,... às arxiv.org 04-05-2024
https://arxiv.org/pdf/2211.06073.pdfPerguntas Mais Profundas