Core Concepts
실험적 데이터와 텍스트 정보를 활용하여 시간 영역 인과 관계를 효과적으로 발견할 수 있는 방법을 제안한다.
Abstract
이 논문은 실험적 데이터와 텍스트 정보를 활용하여 시간 영역 인과 관계를 발견하는 RealTCD 프레임워크를 제안한다.
먼저, 실험적 데이터에서 개입 대상이 알려지지 않은 경우에도 인과 관계를 발견할 수 있는 점수 기반의 시간 영역 인과 관계 발견 방법을 제안한다. 이를 위해 인접 행렬과 개입 가족에 대한 정규화를 도입하여 개입 대상 정보 없이도 인과 관계를 발견할 수 있다.
또한, 대규모 언어 모델(LLM)을 활용하여 시스템의 텍스트 정보에서 도메인 지식을 추출하고, 이를 초기화에 활용함으로써 데이터 기반 최적화 과정을 안내한다.
실험 결과, 제안한 RealTCD 프레임워크가 기존 방법들에 비해 합성 데이터와 실제 데이터 센터 데이터에서 우수한 성능을 보였다. 특히 개입 대상이 알려지지 않은 경우에도 효과적으로 인과 관계를 발견할 수 있음을 확인하였다.
Stats
개입 대상이 알려진 경우, 제안 방법의 구조 햄밍 거리(SHD)와 구조 개입 거리(SID)가 기존 방법보다 우수하다.
개입 대상이 알려지지 않은 경우, 제안 방법의 SHD와 SID가 기존 방법보다 크게 개선되었다.
실제 데이터 센터 데이터에서 제안 방법은 C2A False를 0으로 유지하면서 A2A True와 C2C True 관계를 더 많이 학습하였다.
Quotes
"실험적 데이터와 텍스트 정보를 활용하여 시간 영역 인과 관계를 효과적으로 발견할 수 있는 방법을 제안한다."
"개입 대상이 알려지지 않은 경우에도 효과적으로 인과 관계를 발견할 수 있음을 확인하였다."