Konsep Inti
신경망의 의사 결정을 '무엇', '어디서', '왜'에 대해 인간이 이해할 수 있는 용어로 설명하는 통합 프레임워크 WWW를 제안합니다.
Abstrak
최근 신경망의 발전은 다양한 분야에서 놀라운 성능을 보여주고 있지만, "블랙 박스" 문제는 여전히 남아 있습니다.
WWW는 '무엇', '어디서', '왜'에 대한 설명을 제공하는 새로운 프레임워크로, 개념 발견을 위해 적응적 선택을 활용하고, 신경원 활성화 맵과 Shapley 값의 혼합을 통해 지역적 개념 맵과 히트맵을 생성합니다.
실험 결과, WWW는 해석성 면에서 우수한 성능을 보여주며, 다양한 아키텍처에 적용 가능한 플러그 앤 플레이 솔루션을 제공합니다.
Introduction
신경망의 성능은 인간이 이해할 수 있는 용어로 설명되어야 한다는 요구에 대한 응답으로, 해석 가능한 방법에 대한 문헌에서 일관된 주제가 제시됨.
'무엇', '어디서', '왜'를 설명하는 것은 신경망의 의사 결정을 더 접근 가능하고 인간의 이해에 더 관련성 있게 만드는 접근 방식을 제안함.
Related Works
신경원-개념 연관성, 개념 기반 설명, 그리고 해석 가능한 뉴런 개념에 대한 다양한 연구들이 소개됨.
이전 방법들은 '무엇'을 설명하는 데 주로 초점을 맞추었지만, '어디서'와 '왜'를 설명하는 데는 충분하지 않았음.
Method
WWW는 개념 발견, 지역화, 추론 세 가지 모듈로 구성되어 있으며, 각각 '무엇', '어디서', '왜'를 설명함.
개념 발견 모듈은 각 신경원의 개념을 식별하고, 지역화 모듈은 테스트 샘플의 고유한 입력 영역을 식별하고, 추론 모듈은 중요한 신경원을 식별함.
Experiment
실험 결과, WWW는 '무엇', '어디서', '왜'를 설명하는 데 우수한 성능을 보임.
새로운 방법론을 통해 신경망의 행동에 대한 보다 깊고 자세한 이해를 제공함.
Statistik
최근 신경망 해석 방법에 대한 표
CLIP-Dissect, FALCON, WWW의 성능 비교
Kutipan
"WWW는 '무엇', '어디서', '왜'를 설명하는 통합 솔루션을 제공하며, 전역 해석에서 지역적 설명을 위한 방법을 소개함."
"WWW는 '무엇', '어디서', '왜'를 설명하는 통합 프레임워크로, 인간의 이해를 위한 '무엇'의 설명을 포함하는 혁신적이고 효과적인 방법을 소개함."