本論文は、シンガポールとその周辺地域の言語的・文化的文脈に適応した新しい憎悪スピーチ検出フレームワーク「SGHateCheck」を紹介している。
まず、SGHateCheckは、HateCheckとMHCのアプローチを拡張し、シンガポールの主要言語であるシンガポール英語、マレー語、タミル語、中国語に対応したテストケースを作成している。これらのテストケースは、憎悪的な内容と非憎悪的な内容を明確に区別するよう設計されており、言語的・文化的な微妙な違いを捉えることができる。
次に、SGHateCheckを使って、最先端の大規模言語モデルの性能を評価した。その結果、これらのモデルには以下のような課題が明らかになった:
これらの課題は、従来のデータセットを使った評価では見落とされていた可能性がある。SGHateCheckは、シンガポールやその他の東南アジア地域における効果的な憎悪スピーチ検出モデルの開発を促進することが期待される。
Egy másik nyelvre
a forrásanyagból
arxiv.org
Mélyebb kérdések