แนวคิดหลัก
본 논문에서는 비디오 데이터에서 딥러닝 모델의 예측을 설명하기 위한 제거 기반 프레임워크인 REVEX를 제안하고, 6가지 기존 방법을 비디오에 적용하여 설명력을 평가하고 한계점을 분석합니다.
บทคัดย่อ
REVEX: 비디오 기반 제거 방식 설명 가능 인공지능을 위한 통합 프레임워크 분석
본 논문은 비디오 데이터에서 딥러닝 모델의 예측을 설명하기 위한 제거 기반 프레임워크인 REVEX를 소개하는 연구 논문입니다.
본 연구는 비디오 데이터에서 작동하는 딥러닝 모델의 예측을 설명하는 데 어려움을 해결하고자 합니다. 특히, 기존 이미지 기반 설명 가능 인공지능(XAI) 기법들을 비디오 도메인으로 확장하고, 이를 통해 모델의 예측 근거를 명확히 밝히는 것을 목표로 합니다.
연구진은 먼저 Covert et al. (2017)의 제거 기반 설명 프레임워크를 확장하여 비디오 데이터에 특화된 REVEX 프레임워크를 개발했습니다.
REVEX는 분할, 특징 선택, 샘플 선택, 특징 제거, 시각화 등의 단계로 구성됩니다.
이후 LIME, SHAP, RISE, LOCO, univariate predictors, occlusion sensitivity 등 6가지 기존 이미지 기반 XAI 기법들을 비디오에 적용 가능하도록 수정했습니다.
이를 위해 3D CNN 아키텍처를 활용하고, 시간적 정보를 통합하는 방식으로 기존 기법들을 확장했습니다.
마지막으로 Kinetics 400, UCF101, ETRI-Activity3D 데이터셋과 TimeSformer, TANet, TPN 네트워크를 사용하여 각 기법의 성능을 평가했습니다.
평가에는 삭제 및 보존 게임의 AUC, 평균 감소, 약하게 감독된 객체 지역화 정확도 등의 지표를 활용했습니다.