核心概念
針對音頻深度偽造的識別,訓練聽眾識別專家定義的語言特徵,可以顯著降低他們在評估音頻片段時的猶豫程度,並提高他們正確識別最初不確定片段的能力。
摘要
書目資訊
Bhalli, N. N., Naqvi, N., Evered, C., Mallinson, C., & Janeja, V. P. (2024). Listening for Expert Identified Linguistic Features: Assessment of Audio Deepfake Discernment among Undergraduate Students. arXiv preprint arXiv:2411.14586v1.
研究目標
本研究旨在評估,針對音頻深度偽造的識別,訓練聽眾識別專家定義的語言特徵,是否能提高聽眾的意識和感知能力,從而提高他們辨別虛假音頻的能力。
研究方法
- 研究人員招募了 264 名大學生,將他們分為實驗組和對照組。
- 實驗組接受了一個簡短的培訓模組,該模組教授學生五種專家定義的語言特徵 (EDLFs),這些特徵可以作為識別音頻深度偽造的線索。
- 對照組則閱讀了一篇關於深度偽造的簡短文章,重點關注音頻深度偽造。
- 在培訓前後,所有學生都參與了一項聽力測試,他們需要聽 20 個音頻片段(4 個真實音頻,16 個虛假音頻),並判斷每個片段是真實的、虛假的還是不確定的。
主要發現
- 接受培訓的學生在評估音頻片段時的猶豫程度顯著降低。
- 實驗組在正確識別最初不確定片段的能力方面有所提高,特別是在識別虛假片段方面。
- 對照組在識別真實片段的準確率方面有顯著提高。
- 女性學生在接受培訓後,猶豫程度的降低幅度更大。
- 以英語為母語的學生在表達不確定性方面的程度也有所降低。
主要結論
- 訓練聽眾識別專家定義的語言特徵可以提高他們對音頻深度偽造的辨別能力,特別是在降低猶豫程度和提高對虛假片段的識別準確率方面。
- 開發針對特定社會群體需求的干預措施和教育材料非常重要,例如,將英語作為第二語言或其他語言學習的人。
- 除了基於可聽語言線索提高聽眾準確性的努力外,數字媒體素養教育也很重要。
研究意義
這項研究強調了通過培訓提高公眾對音頻深度偽造意識和辨別能力的重要性。研究結果對設計有效的教育干預措施具有啟示意義,可以幫助人們識別和應對日益增多的音頻深度偽造現象。
研究局限與未來方向
- 培訓模組相對簡短,未來研究可以探索更全面和深入的培訓內容。
- 未來研究可以進一步探討不同社會群體在音頻深度偽造辨別能力方面的差異,並開發更有針對性的干預措施。
統計資料
264 名大學生參與了研究。
學生們需要聽 20 個音頻片段,其中 4 個是真實的,16 個是虛假的。
訓練模組教授了 5 種專家定義的語言特徵。
實驗組在識別虛假片段時,不確定性顯著降低。
對照組在識別真實片段的準確率方面有顯著提高。
引述
"This incident suggests that humans can not only be made aware of deepfakes, but also trained to better discern the veracity of audio they encounter."
"Our work is the first to use sociolinguistics-informed techniques to address listeners’ audio deepfake discernment."
"Our findings indicate the need for a more comprehensive and holistic approach to training for deepfake discernment."