Core Concepts
大規模言語モデルの創造的な問題解決能力を高めるため、人間による評価を活用したチェーン・オブ・シンキング・プロンプトの最適化手法を提案する。
Abstract
本研究では、大規模言語モデルの創造的な問題解決能力を高めるため、チェーン・オブ・シンキング・プロンプトの最適化手法を提案している。
まず、ランダムにサンプリングした訓練データに基づいて初期のチェーン・オブ・シンキング・プロンプトを作成し、テストデータに適用する。その出力結果を分析して、異なるカテゴリーの推論パターンを特定する。次に、人間による評価を行い、各カテゴリーの課題を特定する。この知見に基づいて、新しいチェーン・オブ・シンキング・プロンプトを開発する。この反復的なプロセスにより、特に敵対的なデータセットに対する大規模言語モデルの性能を大幅に向上させることができた。
さらに、この手法を通じて、データセット自体の問題点も特定できた。複数の論理的な解答が可能な問題や、前提条件では解答できない問題などが見つかった。これらの知見は、今後のデータ収集や合成の改善につながる。
Stats
大規模言語モデルは、論理的推論を要する課題では優れた成績を収めるが、創造的思考を必要とする課題では相対的に低い成績に留まる。
本研究で提案したチェーン・オブ・シンキング・プロンプトの最適化手法により、特に敵対的なデータセットに対する大規模言語モデルの性能を大幅に向上させることができた。
人間による評価を活用することで、データセット自体の問題点も特定できた。複数の論理的な解答が可能な問題や、前提条件では解答できない問題などが見つかった。
Quotes
"大規模言語モデルの創造的な問題解決能力を高めるため、人間による評価を活用したチェーン・オブ・シンキング・プロンプトの最適化手法を提案する。"
"この反復的なプロセスにより、特に敵対的なデータセットに対する大規模言語モデルの性能を大幅に向上させることができた。"
"人間による評価を活用することで、データセット自体の問題点も特定できた。複数の論理的な解答が可能な問題や、前提条件では解答できない問題などが見つかった。"