대규모 언어 모델(LLM)의 추론 능력을 향상하기 위해 인간의 사고 방식에서 영감을 받은 De-In-Ductive (DID) 방법론을 제안하며, 이는 귀납적 추론과 연역적 추론을 동시에 활용하여 LLM이 복잡하고 다양한 문제에 더욱 효과적으로 대응하도록 돕는 방법이다.
Critic-CoT, a novel framework, leverages a step-wise Chain-of-Thought critique and distant supervision to enhance the reasoning abilities of Large Language Models, pushing them towards more deliberate, System-2-like reasoning and achieving significant performance improvements on mathematical and reasoning tasks.