Core Concepts
大規模言語モデルのチェーン・オブ・シンキング(CoT)プロンプティングにおいて、デモンストレーションのパターンの多様性が重要な役割を果たす。パターン認識型CoT(PA-CoT)は、デモンストレーションのパターンの多様性を考慮することで、推論性能を大幅に向上させることができる。
Abstract
本論文は、大規模言語モデルのチェーン・オブ・シンキング(CoT)プロンプティングにおいて、デモンストレーションのパターンの多様性が重要な役割を果たすことを示している。
具体的には以下の点が明らかになった:
従来のAuto-CoTは、質問のセマンティクスに基づいてクラスタリングを行うが、これでは推論プロセスのパターンを十分に捉えられない。
PA-CoTでは、デモンストレーションの「ステップ長」と「推論プロセス」の2つの側面に着目し、これらの多様性を考慮することで、推論性能を大幅に向上させることができる。
ステップ長の多様性は、推論の複雑さのバランスを取ることに役立つ。一方、推論プロセスの多様性は、バイアスの低減に寄与する。
ステップ長とプロセスの両方の側面を組み合わせたPA-CoT-concatが最も優れた性能を示した。これは、多角的な視点から多様性を捉えることの重要性を示唆している。
PA-CoTは、デモンストレーションの正確性に依存せず、むしろパターンの多様性に着目することで、ロバストな推論を実現できる。
総じて、本研究は大規模言語モデルのCoTプロンプティングにおいて、デモンストレーションのパターンの多様性が重要な役割を果たすことを明らかにした。
Stats
多くのデモンストレーションが不正解であるにもかかわらず、PA-CoTは優れた性能を発揮した。
PA-CoT-concatでは、デモンストレーションの平均ステップ長が中程度に保たれ、幅広い範囲をカバーできていた。
Quotes
「大規模言語モデルのCoTプロンプティングにおいて、デモンストレーションの正確性よりも、その背後にある推論パターンの多様性が重要な役割を果たす」