Core Concepts
온라인 공간에서 확산되는 혐오 발언에 대응하기 위해 자연어 처리 기술을 활용한 다양한 접근법이 제안되고 있다. 이 논문은 혐오 발언 대응을 위한 NLP 기술의 현황과 실천 방안을 종합적으로 소개한다.
Abstract
이 논문은 온라인 혐오 발언에 대응하기 위한 자연어 처리 기술의 활용 방안을 종합적으로 다루고 있다.
먼저 혐오 발언 대응의 개념과 전략을 정의하고, 관련 연구 과제들을 소개한다. 혐오 발언 탐지, 대응 메시지 선별, 대응 메시지 생성 등 다양한 NLP 과제들이 다루어지고 있음을 확인할 수 있다.
이어서 데이터 수집, 과제 설계, 평가 방법 등 NLP 연구 수행을 위한 단계별 가이드라인을 제시한다. 실제 연구 사례를 바탕으로 각 단계에서 고려해야 할 사항과 모범 사례를 상세히 설명한다.
마지막으로 언어와 문화의 다양성, 혐오 발언의 유형, 생성 모델의 신뢰성, 평가 방법의 한계 등 향후 해결해야 할 과제들을 제시한다. 이를 통해 혐오 발언 대응을 위한 NLP 기술의 발전 방향을 제안한다.
Stats
온라인 공간에서 혐오 발언은 종종 오프라인 폭력과 연결되어 있다.
혐오 발언에 노출되거나 받는 것은 피해자의 정신 건강에 해롭다.
혐오 발언 대응은 표현의 자유를 보장하면서도 온라인 및 오프라인 폭력을 줄일 수 있는 효과적인 전략이다.
Quotes
"혐오 발언 대응은 공격적이지 않은 텍스트 피드백으로, 신뢰할 수 있는 증거, 사실적 논거, 대안적 관점을 사용한다."
"혐오 발언 대응은 관계적 성격을 가지며, 혐오 발언에 대한 반응으로만 존재한다."
"혐오 발언 대응은 혐오 발언을 억제하고 사람들의 인식을 변화시키는 것을 목표로 한다."