本論文は、従来のデータセットでは扱われていない新しい種類のフェイクオーディオ検出に取り組んでいる。従来のデータセットでは、音色、韻律、言語内容、チャンネルノイズなどを変更したフェイクオーディオが主に扱われていた。しかし、本論文では、音声シーンを別のシーンで操作したフェイクオーディオを検出するためのデータセットを提案している。
データセットの構成は以下の通り:
また、本論文では、提案したデータセットに対するいくつかのベースラインモデルの評価実験を行っている。その結果、従来のモデルではシーンフェイクオーディオを十分に検出できないことが示された。
Ke Bahasa Lain
dari konten sumber
arxiv.org
Wawasan Utama Disaring Dari
by Jiangyan Yi,... pada arxiv.org 04-05-2024
https://arxiv.org/pdf/2211.06073.pdfPertanyaan yang Lebih Dalam