本文介紹了GdVAE,這是一個基於條件變分自動編碼器(CVAE)的自我解釋模型,具有高斯判別分析(GDA)分類器和內置的反事實解釋功能。
GdVAE有三個主要分支:
GdVAE通過端到端的聯合訓練,實現了分類器和反事實生成之間的緊密耦合。這不僅確保了潛在空間的正則化,還提高了反事實的真實性和一致性。
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Anse... lúc arxiv.org 09-20-2024
https://arxiv.org/pdf/2409.12952.pdfYêu cầu sâu hơn