แนวคิดหลัก
본 논문에서는 대규모 언어 모델(LLM)을 활용하여 사용자가 정의한 인과 구조를 가진 데이터를 생성하고, 이를 통해 인과 추론 방법론을 평가하는 새로운 벤치마크를 제시합니다.
บทคัดย่อ
언어 모델 기반 인과 관계 생성 및 추론 벤치마크: SD-SCM 소개
본 연구 논문에서는 대규모 언어 모델(LLM)을 활용하여 사용자가 정의한 인과 구조를 가진 데이터를 생성하는 방법론과 이를 인과 추론 방법론 평가를 위한 벤치마크로 활용하는 방안을 제시합니다.
본 연구는 LLM을 이용하여 인과 관계가 명확하게 정의된 데이터를 생성하고, 이를 통해 기존 인과 추론 방법론의 성능을 체계적으로 평가할 수 있는 새로운 벤치마크를 구축하는 것을 목표로 합니다.
본 논문에서 제시하는 **순차적 구조적 인과 모델(SD-SCM)**은 LLM과 사용자 정의 방향성 비순환 그래프(DAG)를 결합하여 순차적 데이터 생성 과정에 인과 구조를 부여합니다. SD-SCM은 LLM을 통해 변수 간의 구조적 관계를 정의하고, 이를 기반으로 관측, 개입, 반사실적 분포를 생성합니다.
연구진은 유방암 치료법 선택에 대한 SD-SCM을 구축하여 14개 변수(환자 나이, 건강 상태, 약물 복용 여부 등)와 치료법(PD-L1 발현 수준에 따른 치료 계획) 간의 인과 관계를 모의했습니다. 다양한 LLM(GPT-2, Llama-3-8b)을 활용하여 1,000개의 데이터셋을 생성하고, 각 데이터셋에 대해 다양한 인과 추론 알고리즘(Causal Forest, DML, DR, BART 등)을 적용하여 SATE, CATE, ITE를 추정했습니다.