이 데이터셋은 폴란드의 인기 소셜 미디어 플랫폼 Wykop.pl에서 수집된 유해 및 중립 콘텐츠로 구성되어 있으며, 자동화된 온라인 콘텐츠 조절을 위한 NLP 전문가들에게 중요한 자원이 될 것이다.
대규모 언어 모델의 텍스트 이해 능력을 활용하여 입력 텍스트에서 근거를 추출하고, 이를 기반으로 혐오 발언 탐지기를 학습함으로써 해석 가능성을 높일 수 있다.