核心概念
지식 그래프 링크 예측 기법을 활용하여 CLEVRER-Humans 데이터셋에서 인과 관계를 발견할 수 있다.
要約
이 논문은 인과 관계 발견 문제를 지식 그래프 링크 예측 문제로 정의하고, CLEVRER-Humans 데이터셋을 활용하여 이를 평가한다. 주요 내용은 다음과 같다:
- 인과 관계를 지식 그래프로 표현하고, 인과 관계의 강도를 나타내는 인과 가중치를 도입한다.
- 인과 관계 발견 문제를 인과 설명(causal explanation)과 인과 예측(causal prediction)의 두 가지 하위 문제로 정의한다.
- 기존의 무작위 데이터 분할 방식과 달리, 마르코프 속성에 기반한 새로운 데이터 분할 방식을 제안한다.
- 다양한 지식 그래프 임베딩 알고리즘을 활용하여 인과 관계 발견 성능을 평가한다.
- 실험 결과, 인과 가중치를 고려한 모델이 인과 관계 발견 성능을 향상시킨다.
統計
인과 관계의 강도를 나타내는 인과 가중치는 0에서 5 사이의 값을 가진다.
실험에 사용된 CLEVRER-Humans 데이터셋은 764개의 인과 관계 그래프로 구성되어 있다.
전체 데이터셋 중 80%는 학습 데이터, 20%는 테스트 데이터로 사용되었다.
引用
"인과 관계 발견은 관찰 데이터로부터 새로운 인과 관계를 찾는 과정이다."
"전통적인 인과 관계 발견 기법은 결측 데이터 문제에 시달리곤 한다."
"인과 관계 발견 문제를 지식 그래프 링크 예측 문제로 정의하면 이러한 문제를 해결할 수 있다."