מושגי ליבה
본 논문에서는 소셜 미디어 사용자를 위한 유해 콘텐츠 검열 도구인 DeMod를 소개합니다. DeMod는 설명 가능한 탐지 기능과 개인 맞춤형 수정 기능을 제공하여 사용자가 유해 콘텐츠를 더 잘 이해하고 수정할 수 있도록 돕습니다.
תקציר
본 논문은 소셜 미디어에서 증가하는 유해 콘텐츠 문제를 해결하기 위해 설명 가능한 탐지 및 개인 맞춤형 수정 기능을 갖춘 새로운 유해 콘텐츠 검열 도구인 DeMod를 제안합니다.
Weibo 사용자 대상 요구사항 조사 연구
연구팀은 먼저 Weibo 사용자를 대상으로 유해 콘텐츠 검열에 대한 요구사항 조사 연구를 수행했습니다. 설문 조사와 인터뷰를 통해 사용자들은 기존의 자체 검열 및 플랫폼 검열 방식의 문제점을 지적하며, 더욱 정확하고 사용자 친화적인 검열 도구의 필요성을 강조했습니다.
DeMod의 주요 기능
이러한 요구사항을 기반으로 개발된 DeMod는 ChatGPT를 기반으로 하며 다음과 같은 주요 기능을 제공합니다.
- 설명 가능한 탐지: 유해 콘텐츠 분류(유해/무해) 및 관련 키워드를 제공하며, 즉각적인 설명과 동적 설명을 통해 사용자의 이해를 돕습니다. 즉각적인 설명은 특정 키워드가 유해한 이유를 명확히 설명하고, 동적 설명은 게시물에 대한 잠재적 청중의 태도를 시뮬레이션하여 사용자가 콘텐츠의 잠재적 영향을 파악할 수 있도록 합니다.
- 개인 맞춤형 수정: 유해 콘텐츠를 수정하기 위한 제안을 제공하면서 원래 의미와 사용자의 개인화된 언어 스타일을 최대한 유지합니다. 사용자의 과거 게시물을 학습하여 개인 맞춤형 수정을 가능하게 합니다.
DeMod의 성능 평가
연구팀은 DeMod의 성능을 평가하기 위해 자동 평가 및 사용자 평가를 수행했습니다. 자동 평가 결과 DeMod는 기존 유해 콘텐츠 탐지 도구인 Perspective API보다 높은 정확도를 보였습니다. 또한 사용자 평가 결과 DeMod는 높은 수준의 사용자 수용도, 사용 편의성 및 제어 가능성을 보였습니다.
DeMod의 의의
DeMod는 기존 유해 콘텐츠 검열 도구의 한계를 극복하고 사용자 중심적인 접근 방식을 통해 유해 콘텐츠 문제 해결에 기여할 수 있는 가능성을 제시합니다. 특히 설명 가능한 탐지 및 개인 맞춤형 수정 기능은 사용자의 자율성을 강화하고 유해 콘텐츠에 대한 인식을 제고하는 데 효과적일 것으로 기대됩니다.
סטטיסטיקה
Weibo는 월 6억 명의 활성 사용자를 보유하고 있습니다.
2022년 11월부터 2023년 8월까지 Weibo에서 식별된 공격적인 표현의 수는 1억 2천만 개를 넘었습니다.
설문 조사에 참여한 Weibo 사용자 493명 중 355명(71.60%)이 게시물을 검열한다고 답했습니다.
DeMod의 유해 콘텐츠 탐지 정확도는 GPT-4 모델 사용 시 73.50%, GPT-3.5-turbo 모델 사용 시 69.35%로 나타났습니다.
DeMod의 유해 콘텐츠 수정 기능은 유해 샘플의 비율을 94.38% 감소시켰습니다.
ציטוטים
"이 도구는 내 머리를 크게 비워줄 수 있습니다. 나는 종종 내 말이 다른 사람들에게 상처를 줄 수 있다는 것을 알지 못합니다."
"키워드를 직접 강조 표시해야 합니다. 나는 시간을 낭비하고 싶지 않습니다. 그냥 게시물일 뿐입니다."
"자동 수정 기능은 몇 가지 제안을 제공해야 하며 직접 게시해서는 안 됩니다. 직접 수정하는 것을 선호합니다."