本論文は、個人的な悩みに対するアドバイスを提供する質問応答システムの構築に向けた取り組みを紹介している。従来の質問応答システムは客観的な問題に対する回答を提供することに特化していたが、個人的な悩みに対するアドバイスの提供には課題があった。
そこで本研究では、RedditのLifeProTipsフォーラムから収集した1万以上の個人的な悩みに関する質問とそれに対する8.9件の回答平均を含むAdvisorQAデータセットを構築した。このデータセットを用いて、有益性と無害性の2つの側面から質問応答システムの性能を評価する手法を提案している。
具体的には、多数の投票による回答の順位付けを活用した有益性評価指標と、有害性検知モデルを組み合わせることで、LLMの個人的なアドバイス提供能力を分析している。実験の結果、大規模LLMは有益性は高いものの、無害性に課題があることが明らかになった。また、教師あり微調整やリインフォースメント学習による改善手法を検討し、両者のトレードオフを分析している。
本研究は、個人的な悩みに対するアドバイス提供を目的とした質問応答システムの構築に向けた重要な一歩を示しており、LLMの主観的な理解力向上に寄与するものと期待される。
翻譯成其他語言
從原文內容
arxiv.org
深入探究