Core Concepts
大規模言語モデルの多言語における多段階推論能力を向上させるための「Cross-ToT」手法を提案する。異なる言語間で自己整合的な推論プロセスを生成し、最終的な解答に収束させる。
Abstract
本論文では、大規模言語モデルの多言語における多段階推論能力を向上させるための「Cross-ToT」手法を提案している。従来の手法では、言語間の不均衡により、英語以外の言語での推論能力が限定的であった。
Cross-ToTは、Tree-of-Thoughtsのアプローチに着想を得て、異なる言語間で並行して推論プロセスを生成し、それらが自己整合的に収束していく仕組みを持つ。具体的には、以下のような流れで推論を行う:
異なる言語の専門家が個別に推論を開始する
各専門家は自身の推論プロセスを説明しながら、他の専門家との比較・検討を行う
この過程を繰り返し、最終的な答えに収束させる
実験の結果、Cross-ToTは従来手法と比べて大幅な性能向上を示した。特に、低リソース言語や英語以外の言語においても優れた推論能力を発揮することが確認された。
さらに、推論プロセスの分析からは、Cross-ToTが自己修正的な推論を実現できていることが明らかになった。つまり、異なる言語間の推論プロセスが相互に影響し合い、最終的な答えに収束していくのである。
本研究は、大規模言語モデルの多言語推論能力を飛躍的に向上させる重要な一歩となっている。今後は、より小規模なモデルへの適用や、さまざまなタスクへの展開が期待される。
Stats
利亜有32块巧克力,她妹妹有42块。如果她们吃了35块,她们一共还剩下多少块?
利亚有32块巧克力,她妹妹有42块。如果她们吃了35块,她们一共还剩下多少块?
Leah has 32 chocolates and her sister has 42. If they ate 35 pieces, how many pieces do they have left?
Quotes
"我们提出了Cross-ToT,这是一种新的跨语言提示机制,激励模型生成并行的跨语言推理过程。"
"我们的Cross-ToT是自洽的,允许不同语言之间的推理路径进行整合。"
"广泛的评估表明,我们的Cross-ToT可以有效地提高跨语言CoT的性能,并达到最先进的水平。"