Concepts de base
本文提出了一個以品質為中心的框架,用於解決 Deepfake 檢測中的泛化問題,通過評估偽造品質、增強低品質數據和採用課程學習策略來提高檢測模型的泛化能力。
論文資訊
Wentang Song, Zhiyuan Yan, Yuzhen Lin, Taiping Yao, Changsheng Chen, Shen Chen, Yandan Zhao, Shouhong Ding, Bin Li. A Quality-Centric Framework for Generic Deepfake Detection. JOURNAL OF LATEX CLASS FILES, VOL. 14, NO. 8, AUGUST 2021.
研究目標
本研究旨在解決 Deepfake 檢測中模型泛化能力不足的問題,特別是在面對跨資料集和未知偽造方法時的性能下降。
方法
本研究提出了一個以品質為中心的框架,該框架包含三個主要模組:
偽造品質評估器(Quality Evaluator):
靜態評估:利用人臉識別網路(ArcFace)計算偽造人臉與真實人臉之間的特徵相似度,相似度越高,偽造品質越高。
動態評估:根據模型在訓練過程中對每個樣本的反饋來評估偽造品質,預測機率越低,表示樣本越難以檢測,偽造品質越高。
最終將靜態和動態評估結果加權求和,得到偽造品質分數(Forgery Quality Score, FQS)。
低品質數據增強模組(FreDA):
針對低品質樣本,利用頻率域數據增強(Frequency Data Augmentation, FreDA)技術,保留真實人臉的低頻特徵,並結合原始偽造樣本的高頻特徵,重建新的增強樣本,提高其真實性和難以檢測的程度。
學習進度策略:
採用課程學習(Curriculum Learning)策略,根據 FQS 對訓練樣本進行排序,從易到難逐步提高訓練難度。
在訓練過程中,逐步減少訓練樣本數量,並使用 FreDA 增強低品質樣本,使模型更加關注難以檢測的樣本,從而提高泛化能力。
主要發現
靜態品質評估可以有效地區分不同品質的偽造樣本,而動態品質評估可以捕捉模型在訓練過程中的學習進度,兩者結合可以更全面地評估偽造品質。
FreDA 可以有效地增強低品質樣本的真實性,使其更難以被檢測,從而提高模型的泛化能力。
課程學習策略可以引導模型逐步學習更難的樣本,避免模型過擬合於簡單樣本,從而提高泛化能力。
主要結論
本研究提出的以品質為中心的框架可以顯著提高 Deepfake 檢測模型的泛化能力,特別是在跨資料集和未知偽造方法的場景下。
意義
本研究為 Deepfake 檢測提供了一種新的思路,即通過關注偽造品質來提高模型的泛化能力,這對於應對日益複雜的 Deepfake 偽造技術具有重要意義。
局限與未來研究方向
本研究主要關注人臉偽造,未來可以探索將該框架應用於其他模態的偽造檢測,例如語音、影片等。
FreDA 的參數需要根據不同的數據集進行調整,未來可以探索更通用的數據增強方法。
Stats
在 FF++ 數據集中,59.44% 的偽造影片是使用不同種族或性別的人臉進行交換生成的。
使用 FreDA 技術增強低品質樣本後,模型在 Celeb-DF 數據集上的 AUC 平均提升了 4%,在 Wild 數據集上提升了 5%,在 FF++ 數據集上提升了 10%。