核心概念
본 논문에서는 여러 작업에서 학습된 모델의 희소 직교 매개변수를 병합하면 기존 지식을 잊어버리지 않고 새로운 작업에 적응하는 지속적인 학습(Continual Learning)에서 뛰어난 성능을 발휘한다는 것을 보여줍니다.
摘要
지속적인 학습을 위한 희소 직교 매개변수 조정 연구 논문 요약
제목: 지속적인 학습을 위한 희소 직교 매개변수 조정 (Sparse Orthogonal Parameters Tuning for Continual Learning)
저자: Kun-Peng Ning, Hai-Jian Ke, Yu-Yang Liu, Jia-Yu Yao, Yong-Hong Tian, Li Yuan*
기관: 북경대학교 전자컴퓨터공학부
발행: arXiv:2411.02813v1 [cs.LG] 5 Nov 2024 (프리프린트 버전)
본 연구는 딥러닝 모델이 새로운 작업을 지속적으로 학습하면서 이전에 습득한 지식을 잊어버리는 치명적인 망각(catastrophic forgetting) 문제를 해결하는 것을 목표로 합니다. 특히, 여러 작업에서 학습된 모델의 희소 직교 매개변수를 병합하여 새로운 작업에 적응하면서 기존 지식을 효과적으로 유지하는 방법을 제시합니다.