Conceptos Básicos
ラージ言語モデルを用いて、会話の結果を指向したカウンタースピーチを生成する手法を提案し、その有効性を検証する。
Resumen
本研究は、ラージ言語モデルを用いて、ヘイトスピーチに対するカウンタースピーチを生成する際に、会話の結果を指向した手法を提案している。具体的には以下の通り。
- 会話の結果を表す2つの指標、すなわち会話の非礼性レベルと加害者の再参加行動を定義し、それらを予測するための分類器を構築した。
- 4つの手法、すなわち命令付きプロンプト、プロンプトと選択、LLMファインチューニング、LLM強化学習を提案し、それらの手法を用いてカウンタースピーチを生成した。
- 生成されたカウンタースピーチの関連性、品質、多様性、新規性を評価するとともに、期待される会話の結果を予測する分類器を用いて評価した。
- 実験の結果、提案手法のうち特にプロンプトと選択、LLM強化学習が、期待される会話の結果を持つカウンタースピーチを生成する上で有効であることが示された。一方で、生成されたカウンタースピーチの品質や多様性にはトレードオフの関係があることも明らかになった。
Estadísticas
ヘイトスピーチに対するカウンタースピーチの生成では、会話の非礼性レベルが低く、加害者の再参加が非ヘイトであることが望ましい。
提案手法のうち、プロンプトと選択、LLM強化学習は、期待される会話の結果を持つカウンタースピーチを生成する上で有効である。
Citas
"ラージ言語モデルを用いて、会話の結果を指向したカウンタースピーチを生成する手法を提案し、その有効性を検証する。"
"提案手法のうち特にプロンプトと選択、LLM強化学習が、期待される会話の結果を持つカウンタースピーチを生成する上で有効であることが示された。"