Centrala begrepp
이 연구는 대규모 속성 그래프에서 노드, 엣지, 경로 가설을 정의하고 샘플링 기반 가설 검정 프레임워크를 제안합니다. 이를 위해 경로 가설 인식 샘플러 PHASE와 이의 최적화 버전 PHASEopt를 개발하여 정확성과 효율성을 높였습니다.
Sammanfattning
이 연구는 대규모 속성 그래프에서 가설 검정을 수행하는 프레임워크를 제안합니다.
- 노드, 엣지, 경로 가설을 정의하고 이를 검정할 수 있는 프레임워크를 개발했습니다.
- 기존의 가설 무관 샘플링 방법을 활용할 수 있는 프레임워크를 제안했습니다.
- 가설 인식 샘플러 PHASE와 이의 최적화 버전 PHASEopt를 개발했습니다. PHASE는 가설에 따라 관련 노드, 엣지, 경로를 선택하여 샘플링하며, PHASEopt는 실행 시간을 단축시킵니다.
- 이론적으로 PHASE와 PHASEopt의 가설 추정량 수렴성을 증명했습니다.
- 실험을 통해 PHASEopt가 기존 샘플링 방법에 비해 정확성, 유의성, 효율성 면에서 우수한 성능을 보임을 확인했습니다.
Statistik
평균 인용 수가 50보다 큰 DBLP 컨퍼런스 논문의 비율은 96%입니다.
마이크로소프트 연구원이 작성한 데이터 마이닝 분야 컨퍼런스 논문의 평균 FOS 가중치는 0.76입니다.
DBLP에서 중국 기관 소속 연구자가 작성한 데이터 마이닝 분야 논문의 평균 인용 수는 52.3회입니다.
Citat
"데이터 마이닝 분야 컨퍼런스 논문의 평균 FOS 가중치가 0.5보다 크다."
"중국 기관 소속 연구자가 작성한 데이터 마이닝 분야 논문의 평균 인용 수가 50보다 크다."
"마이크로소프트 연구원이 작성한 컨퍼런스 논문의 평균 인용 수가 전체 평균보다 크다."