Core Concepts
本研究では、大規模言語モデルのプロンプト設計を用いて、幻覚検出のための分類器を構築する。タスク定義、役割定義、概念定義を組み合わせた零shot及び少shot学習アプローチにより、高精度な幻覚検出が可能となった。
Abstract
本研究では、SemEval-2024 Task 6の幻覚検出課題に取り組んだ。大規模言語モデルのプロンプト設計を用いて、二値分類器を構築した。
まず、ステージ1では、タスク定義、役割定義、概念定義を組み合わせた零shot学習により、データセットの分類を行った。これにより、正例と負例のプールを作成した。
次に、ステージ2では、ステージ1で得られた例を用いた少shot学習により、最終的な分類器を構築した。例の選択には、多様性と一貫性のトレードオフを考慮した手法を用いた。
分類器の性能評価では、モデル非依存トラックとモデル依存トラックで、それぞれ4位と6位の成績を収めた。また、人間の評価との一致度も高く、幻覚検出における有効性が示された。
さらに、ハイパーパラメータ調整と ablation studyを行い、概念定義の重要性や、例の選択方法の課題などが明らかになった。
今後は、この手法を、言語モデルの生成結果の評価に応用していく予定である。
Stats
本システムの評価に使用したデータセットの統計情報は以下の通りです。
モデル非依存トラック:
検証データセット: 正例145件、負例354件
テストデータセット: 正例183件、負例514件
モデル依存トラック:
検証データセット: 正例171件、負例328件
テストデータセット: 正例201件、負例544件
Quotes
本研究では以下のような重要な知見が得られました。
"システムの分類結果と人間の評価の一致度が高いことから、この手法が幻覚検出に有効であることが示された。"
"概念定義の除去が精度と相関係数の低下につながったことから、プロンプトへの概念定義の組み込みが重要であることが明らかになった。"
"例の選択方法に課題があり、さらなる検討が必要である。"