Khái niệm cốt lõi
複数の単一タスクモデルを統合するマルチタスクモデルマージにおいて、既存の手法はタスク間の干渉の解決に重点を置いており、セキュリティ上の脅威、特にバックドア攻撃のリスクを軽視している。本稿では、安全性を考慮した新規手法「防御重視マージ(DAM)」を提案し、タスク干渉の軽減とバックドアの脆弱性緩和の同時実現を目指す。
Tóm tắt
マルチタスクモデルマージにおけるバックドア効果軽減:安全性を考慮したサブスペースの活用
Jinluan Yang, Anke Tang, Didi Zhu, Zhengyu Chen, Li Shen, Fei Wu. (2024). Mitigating the Backdoor Effect for Multi-Task Model Merging via Safety-Aware Subspace. arXiv preprint arXiv:2410.13910.
本研究は、複数の単一タスクモデルを統合するマルチタスクモデルマージにおいて、バックドア攻撃に対する脆弱性を軽減することを目的とする。