Core Concepts
피드 포워드 레이어의 메모리 셀을 분해하고 동적으로 할당하여 새로운 지식 습득과 망각 방지를 동시에 달성
Abstract
신경 기계 번역 모델의 사전 학습 후 미세 조정 방식은 성능 향상에 기여했지만, 재앙적 망각 문제가 지속적으로 발생
기존 지속적 학습 방법들은 망각 방지와 확장성 사이의 균형을 유지하는데 어려움을 겪음
F-MALLOC은 피드 포워드 레이어의 메모리 셀을 분해하고 동적으로 할당하여 새로운 지식 습득과 망각 방지를 동시에 달성
구조적 가지치기를 통해 일반 도메인 지식을 보존하고, 학습 마스크를 통해 메모리를 동적으로 할당
이전 과제의 중요 메모리를 읽기 전용으로 지정하여 망각을 방지
다단계 지속적 학습 평가 프로토콜을 제안하여 안정성과 가소성을 종합적으로 평가
실험 결과, F-MALLOC이 기존 방법들보다 우수한 성능과 강건성을 보임
과제 난이도와 유사성을 효과적으로 활용하여 메모리 할당 전략을 최적화
Stats
일반 도메인 모델의 BLEU 점수는 38.00이었음
미세 조정 후 IT 도메인의 BLEU 점수는 48.80이었음
미세 조정 후 Koran 도메인의 BLEU 점수는 22.90이었음
미세 조정 후 Law 도메인의 BLEU 점수는 57.15이었음
미세 조정 후 Medical 도메인의 BLEU 점수는 55.93이었음
미세 조정 후 Subtitles 도메인의 BLEU 점수는 32.01이었음
Quotes
"피드 포워드 레이어는 신경 메모리를 모방하고 중요한 번역 지식을 포함한다."
"F-MALLOC은 피드 포워드 레이어의 메모리 셀을 분해하고 동적으로 할당하여 새로운 지식 습득과 망각 방지를 동시에 달성한다."