מושגי ליבה
그래프 신경망 연구의 재현성을 높이기 위해 재현성 온톨로지를 제안하고, 내재 차원이 모델 성능에 미치는 영향을 조사하였다.
תקציר
이 연구는 기계 학습 분야에서 재현성 문제를 다루고 있다. 먼저 재현성 온톨로지를 제안하여 데이터 세트, 소프트웨어, 계산 결과 등 다양한 측면에서 재현성을 평가할 수 있는 체계를 마련하였다. 이를 바탕으로 약 100편의 그래프 신경망 관련 논문을 조사하고 6편의 논문을 집중적으로 재현해보았다.
데이터 세트 측면에서는 대부분의 논문에서 데이터 전처리 과정에 대한 설명이 부족하였다. 소프트웨어 측면에서는 의존성 정보 누락, 실행 스크립트 미비 등의 문제가 발견되었다. 계산 결과 측면에서는 모델 가중치나 예측 결과를 제공하지 않는 경우가 많았다.
이어서 내재 차원이 모델 성능에 미치는 영향을 실험적으로 분석하였다. 내재 차원 기반 특성 선택 기법을 활용하여 데이터 세트의 내재 차원을 변화시키고, 이에 따른 6개 그래프 신경망 모델의 성능 변화를 관찰하였다. 실험 결과, 내재 차원 변화가 모델 성능에 유의미한 영향을 미치는 것으로 나타났다.
이 연구는 기계 학습 연구의 질과 신뢰성을 높이는 데 기여할 것으로 기대된다.
סטטיסטיקה
데이터 세트의 내재 차원을 변화시키면 그래프 신경망 모델의 성능에 유의미한 영향을 미친다.