Core Concepts
이산화된 관측치를 이용하여 잠재 연속 변수들 간의 조건부 독립성을 정확하게 평가할 수 있는 새로운 검정 방법을 제안한다.
Abstract
이 논문에서는 이산화된 관측치를 이용하여 잠재 연속 변수들 간의 조건부 독립성을 정확하게 평가할 수 있는 새로운 검정 방법인 DCT(Discretization-Corrected Test)를 제안한다.
주요 내용은 다음과 같다:
기존 조건부 독립성 검정 방법들은 변수들의 관측치가 모두 연속일 때만 효과적이지만, 일부 변수가 이산화된 경우 잘못된 결론을 내릴 수 있다. 이를 해결하기 위해 DCT를 제안한다.
DCT는 관측치가 모두 연속, 모두 이산, 혼합(일부 연속, 일부 이산)인 경우 모두 적용 가능하다.
DCT는 이산화된 관측치와 잠재 연속 변수 간의 관계를 나타내는 브릿지 방정식을 설계하여, 잠재 변수들의 공분산과 정밀도 행렬을 추정한다.
추정된 공분산과 정밀도 행렬을 이용하여 조건부 독립성 검정 통계량을 도출하고, 그 점근 분포를 유도한다.
실험 결과, DCT는 기존 방법들에 비해 이산화된 데이터에서 더 정확한 조건부 독립성 검정 결과를 보여준다.
Stats
이산화된 변수 ˜
Xj의 평균을 초과하는 관측치의 비율은 ˆ
τj = Pn
i=1 1{˜
xi
j>Pn ˜
Xj}/n 로 추정할 수 있다.
두 이산화된 변수 ˜
Xj1, ˜
Xj2의 평균을 동시에 초과하는 관측치의 비율은 ˆ
τj1,j2 = 1
n
Pn
i=1 1{˜
xi
j1>Pn ˜
Xj1,˜
xi
j2>Pn ˜
Xj2} 로 추정할 수 있다.
Quotes
"기존 조건부 독립성 검정 방법들은 변수들의 관측치가 모두 연속일 때만 효과적이지만, 일부 변수가 이산화된 경우 잘못된 결론을 내릴 수 있다."
"DCT는 이산화된 관측치와 잠재 연속 변수 간의 관계를 나타내는 브릿지 방정식을 설계하여, 잠재 변수들의 공분산과 정밀도 행렬을 추정한다."