시각적 질문 답변을 위한 해석 가능한 설계 모델인 동적 단서 병목 모델(DCLUB)을 제안한다. DCLUB는 중간 단계의 인간 가독성 있는 설명을 제공하여 모델의 예측 과정을 이해할 수 있게 하면서도 기존 블랙박스 모델과 유사한 성능을 달성한다.