환경 요인으로 인한 혼란 요인을 제거하여 강건하고 일반화된 궤적 표현을 학습하는 것이 핵심 목표이다.
CausalBench is a comprehensive benchmark designed to thoroughly evaluate the causal learning capabilities of large language models (LLMs) across diverse datasets, tasks, and prompt formats.