最新の零細TTS技術によって生成された音声データを含む大規模なクロスドメインデータセットを構築し、様々な攻撃手法に対する音声ディープフェイク検出モデルの性能を評価・分析した。その結果、攻撃手法の導入や少量データでの学習により、高い汎化性能を実現できることを示した。一方で、ニューラルコーデックによる圧縮が検出精度に大きな影響を及ぼすことも明らかにした。