이 연구는 사람들이 이미지, 오디오, 비디오, 오디오-비주얼 미디어의 진위 여부를 얼마나 정확하게 판단할 수 있는지 조사했다. 1,276명의 참가자를 대상으로 실험을 진행했으며, 다음과 같은 주요 결과를 도출했다:
전체적인 탐지 정확도는 51.2%로 동전 던지기 수준에 불과했다. 이는 사람들의 지각 능력만으로는 실제 미디어와 인공지능 생성 미디어를 구분하기 어렵다는 것을 보여준다.
탐지 정확도는 콘텐츠의 특성에 따라 달랐다. 얼굴이 포함된 이미지, 단일 모달리티 콘텐츠, 외국어 콘텐츠에서 정확도가 낮았다. 반면 다중 모달리티 콘텐츠, 모국어 콘텐츠에서 정확도가 높았다.
참가자의 사전 지식 수준은 탐지 성능에 영향을 미치지 않았다. 이는 현재의 대중적 지식으로는 인공지능 생성 미디어를 효과적으로 탐지하기 어렵다는 것을 시사한다.
이 연구 결과는 사람들의 지각 능력만으로는 인공지능 생성 미디어에 대한 효과적인 방어책이 될 수 없음을 보여준다. 따라서 기술적, 교육적 대응책 등 다양한 대책 마련이 시급한 상황이다.
Na inny język
z treści źródłowej
arxiv.org
Głębsze pytania