ナイジェリアのTwitterデータを用いた憎悪表現検出モデルの評価により、従来の手法では実世界の性能を過大評価していることが明らかになった。ドメイン適応プリトレーニングとファインチューニングにより、実世界での性能を大幅に向上させることができる。また、人間レビューを活用したモデレーションアプローチの可能性も示された。