이 논문은 시각적 분류 작업에서 모델의 해석성과 성능을 향상시키기 위한 새로운 개념 학습 프레임워크를 제시한다. 제안하는 접근법은 주요 분류기 네트워크에 비지도 설명 생성기를 추가하고 적대 학습을 활용한다. 학습 과정에서 설명 모듈은 분류기의 잠재 표현에서 시각적 개념을 추출하도록 최적화되며, GAN 기반 모듈은 개념에서 생성된 이미지와 실제 이미지를 구분하도록 훈련된다. 이러한 공동 학습 체계를 통해 모델은 내부적으로 학습한 개념을 인간이 해석할 수 있는 시각적 속성과 암묵적으로 정렬할 수 있다. 광범위한 실험을 통해 제안 방식의 강건성을 입증하고 일관된 개념 활성화를 생성한다. 학습된 개념을 분석하여 객체 부품 및 시각적 속성과의 의미론적 일치를 보여준다. 또한 적대 학습 프로토콜의 변화가 분류와 개념 획득에 미치는 영향을 연구한다. 요약하면, 이 연구는 실제 세계 인지 작업을 위한 신뢰할 수 있는 AI 개발의 핵심 요소인 내재적으로 해석 가능한 심층 비전 모델과 작업 정렬 개념 표현을 구축하는 데 있어 중요한 진전을 보여준다.
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問