페이스북의 41개 혐오 스피치 정책에 부합하는 혐오 및 비혐오 문장 데이터셋 HateModerate를 구축하고, 이를 통해 최신 혐오 스피치 탐지기의 정책 준수 성능을 평가하였다. 평가 결과, 대부분의 모델이 정책 준수에 실패하는 것으로 나타났으며, HateModerate를 활용한 모델 fine-tuning이 정책 준수 성능 향상에 효과적임을 확인하였다.