核心概念
本文介紹了1百萬級深度偽造檢測挑戰,旨在推動深度偽造檢測和定位技術的發展。該挑戰基於最新發布的AV-Deepfake1M數據集,包含超過1百萬個經過操縱的高質量音視頻樣本,涉及2000多個主體。參與者需要提交用於檢測和定位任務的推理結果,以評估其性能。
摘要
本文介紹了1百萬級深度偽造檢測挑戰(1M-Deepfakes Detection Challenge)。該挑戰基於最新發布的AV-Deepfake1M數據集,這是一個大規模的音視頻深度偽造數據集,包含超過1百萬個經過操縱的高質量視頻樣本,涉及2000多個主體。
挑戰包括兩個主要任務:
深度偽造檢測:識別給定的單個主體的音視頻樣本是否為深度偽造。
深度偽造時間定位:確定音視頻樣本中被操縱或虛假的具體時間間隔。
為確保提交模型的健壯性,數據集被分為訓練、驗證和測試集。測試集中的所有音頻操縱都是使用高質量的VITS模型生成的。
評估指標包括:
深度偽造檢測:使用ROC曲線下面積(AUC)。
深度偽造時間定位:使用平均精度(AP)和平均召回率(AR)。
本文還提供了基線模型在AV-Deepfake1M數據集上的性能基準。
該挑戰旨在推動深度偽造檢測和定位技術的發展,並將作為未來幾年的持續基準,隨著深度偽造技術的快速發展而不斷引入新的挑戰。
統計資料
深度偽造檢測任務中,基線模型的ROC曲線下面積(AUC)在0.9左右。
深度偽造時間定位任務中,基線模型的平均精度(AP)和平均召回率(AR)在0.6-0.7之間。