この記事では、大規模言語モデル(LLMs)に対するProxy Metric-based Self-Refinement(ProMiSe)アプローチが紹介されています。ProMiSeは、外部メトリクスフィードバックを活用して、品質の主要次元に沿って自己初期応答を洗練し、最終的な応答を向上させることができます。具体的には、FLAN-T5-XXLおよびLLAMA-2-13B-CHATのオープンソース言語モデルにProMiSeを適用し、ドキュメントに基づいた質問回答データセットでパフォーマンスを評価します。また、多面的な自己磨きを実施し、反復的な原則ごとの改善クエリを通じてマルチターンダイアログ生成まで拡張します。これにより、人間注釈データだけでなく合成ダイアログデータでも性能が向上することが示されています。
To Another Language
from source content
arxiv.org
Głębsze pytania