核心概念
RSA-Controlは、プラグマティクスに基づく革新的なテキスト生成フレームワークであり、追加学習なしでテキストの属性(毒性、偏見、可読性など)を制御しながら、流暢さと内容の整合性を維持します。
要約
RSA-Control:プラグマティクスに基づく、軽量で制御可能なテキスト生成フレームワーク
本稿では、Rational Speech Acts (RSA) フレームワークに基づく、新しい制御可能なテキスト生成 (CTG) 手法であるRSA-Controlを紹介する。RSAフレームワークは、話し手と聞き手の相互推論を通じて、効果的かつ効率的な人間間のコミュニケーションを解明するものである。話し手は聞き手の認識について推論することで発話を調整し、聞き手は逆に話し手の意図を推論する。RSAの会話行動モデリングにおける成功に触発され、我々のアプローチは、話し手モジュールと聞き手モジュールの相互作用を明示的にモデル化する。これにより、プラグマティックな話し手は、聞き手が邪魔者に惑わされることなく、望ましい属性を正確に認識できるように発話を生成することができる。
統計
GPT2-smallを用いた場合、6つの毒性属性すべてにおいて平均75.65%の毒性検出精度を達成した。
RSA-Control (˜α ∈[10, 20]) は、毒性確率を8.8%にまで低減した。
CrowS-Pairsベンチマークにおいて、RSA-Controlは9つのバイアスの種類のうち8つにおいて、最も低いバイアス度を示した。
可読性制御のタスクにおいて、RSA-Controlは、デフォルトの要約と比較して、FREスコアを約22増加させた。
引用
"RSA-Control, a novel CTG method that bridges decoding-based and prompt-based paradigms through the computational pragmatic framework of Rational Speech Acts (RSA) (Frank and Goodman, 2012)."
"By replacing fine-tuned discriminator modules with prompted PLMs, RSA-Control combines the robust control of decoding-based methods with the efficiency of training-free prompt-based approaches."
"Instead of utilizing a fixed rationality parameter α throughout the generation process, we adopt a variable ˜α which can take different values within the range [α0, α0 + α1] at each time step n."