사전 소프트맥스 점수를 사용하는 귀속 방법은 모델 출력을 변경하지 않고도 귀속 결과를 크게 변경할 수 있는 취약점이 있다.
본 연구에서는 인공지능 모델의 예측 결과에 대한 설명 가능성을 높이기 위해 열역학 개념을 도입하였다. 이를 통해 모델의 복잡도가 아닌 해석 가능성을 기준으로 최적의 설명을 도출할 수 있다.
개념 활성화 벡터(CAV)는 신경망 내부 표현을 사람이 이해할 수 있는 개념으로 변환하는 데 사용되지만, 이들 벡터는 층 간 일관성이 없고, 다른 개념과 얽혀 있으며, 공간적으로 의존적일 수 있다. 이러한 특성은 CAV 기반 설명 방법의 해석에 영향을 미칠 수 있다.