Core Concepts
복잡계 네트워크 이론은 심층 신경망의 가중치, 뉴런 구조 및 은닉층 동작을 분석하여 해석 가능성을 높일 수 있다.
Abstract
이 연구는 심층 신경망(DNN)을 복잡계 네트워크 이론(CNT)의 관점에서 분석하였다. 기존 CNT 지표들은 입력 데이터의 영향을 고려하지 않아 한계가 있었는데, 이 연구에서는 입력 데이터 분포를 반영한 새로운 지표들을 제안하였다.
실험 결과, 다양한 DNN 아키텍처(완전 연결망, 합성곱 신경망, 순환 신경망, 오토인코더)에서 일관된 패턴이 관찰되었다. 완전 연결망과 오토인코더는 과도하게 많은 음의 가중치를 가지는 경향이 있었고, 합성곱 신경망은 다중 모드의 뉴런 강도 분포를 보였다. 이는 각 아키텍처가 입력 데이터의 특징을 다르게 학습한다는 것을 시사한다.
또한 활성화 함수와 네트워크 깊이에 따른 CNT 지표의 변화를 분석하였다. 비선형 활성화 함수를 사용할 경우 비대칭적인 분포가 관찰되었고, 깊이가 증가할수록 더 복잡한 패턴이 나타났다. 이를 통해 CNT 분석이 DNN의 내부 동작을 이해하고 해석하는 데 도움이 될 수 있음을 보였다.
Stats
입력 데이터 분포에 따라 뉴런 강도가 달라지는 것을 확인할 수 있었다.
학습된 순환 신경망의 뉴런 강도는 입력 이미지의 중심 영역에 집중되어 있었지만, 학습되지 않은 순환 신경망에서는 그렇지 않았다.
Quotes
"복잡계 네트워크 이론은 신경망의 가중치, 뉴런 구조 및 은닉층 동작을 분석하여 해석 가능성을 높일 수 있다."
"각 DNN 아키텍처는 입력 데이터의 특징을 다르게 학습하는 경향이 있다."
"비선형 활성화 함수를 사용할 경우 비대칭적인 분포가 관찰되었고, 깊이가 증가할수록 더 복잡한 패턴이 나타났다."