Concepts de base
본 연구는 그래프 준지도 도메인 적응 문제를 해결하기 위해 그래프 대조 학습과 최소-최대 엔트로피 기반 방법을 제안한다. 이를 통해 소스 그래프의 지식을 활용하여 타겟 그래프의 노드 분류 성능을 향상시킨다.
Résumé
이 논문은 그래프 준지도 도메인 적응 문제를 다룬다. 소스 그래프는 완전히 레이블링되어 있지만, 타겟 그래프는 레이블이 부족한 상황이다.
제안하는 SemiGCL 모델은 다음과 같은 특징을 가진다:
- 그래프 대조 학습을 통해 지역적 및 전역적 구조 정보를 모두 반영하는 노드 표현을 생성한다.
- 최소-최대 엔트로피 기반 도메인 적응 기법을 사용하여 소스 및 타겟 그래프 간 도메인 차이를 줄인다.
- 코사인 유사도 기반 노드 분류기를 활용하여 제한된 타겟 레이블을 효과적으로 활용한다.
실험 결과, SemiGCL은 다양한 벤치마크 데이터셋에서 최신 기법들을 능가하는 성능을 보였다.
Stats
그래프 데이터셋의 노드 수는 2,300 ~ 8,724개 범위이며, 평균 차수는 2.96 ~ 37.18 범위이다.
노드 속성의 공통 비율은 56.92% ~ 97.83% 범위이다.