核心概念
지속적 학습 시나리오에서 과거 지식의 망각 문제를 해결하기 위해 저차원 가중치 교란 기법을 제안하였다. 이를 통해 과거 과제의 지식을 효과적으로 활용하면서도 새로운 과제에 대한 학습 능력을 유지할 수 있다.
摘要
이 논문은 지속적 학습 문제를 해결하기 위한 새로운 방법론을 제안한다. 주요 내용은 다음과 같다:
-
가중치 행렬 변환을 통해 순차적 과제 간 매개변수 전이를 모델링하고, 신경망의 각 층에서 저차원 근사를 적용한다.
-
헤시안 정보와 저차원 근사 오차 간의 정량적 관계를 이론적으로 분석하여, 각 층의 근사 순위를 자동으로 결정한다. 이를 통해 모델 용량을 효과적으로 제어할 수 있다.
-
다양한 벤치마크 데이터셋에 대한 실험 결과, 제안 방법이 정확도, 계산 효율성, 확장성, 과제 순서 강건성 측면에서 우수한 성능을 보인다.
統計資料
저차원 근사 오차는 헤시안 행렬의 프로베니우스 노름과 가중치 교란의 제곱 노름의 곱에 의해 상한이 결정된다.
각 층의 gradient 벡터 노름과 대응되는 특이값의 제곱으로 저차원 근사의 영향을 정량화할 수 있다.
引述
"지속적 학습은 이전에 습득한 지식을 망각하지 않고 순차적으로 새로운 과제를 학습하는 것을 목표로 한다."
"본 연구에서는 헤시안 인식 저차원 가중치 교란 알고리즘(HALRP)을 제안하여, 헤시안 정보를 활용해 각 층의 저차원 근사 순위를 자동으로 결정한다."