核心概念
지속적 학습 문제에서 과제 일관성 점수 차별화 특징 분포를 순차적으로 학습하는 것이 핵심이다. 이를 위해 제한된 메모리 내에서 이전 과제의 데이터를 효과적으로 활용하고, 일반적 및 특정 지식을 분리하여 모델링하는 접근법을 제안한다.
摘要
이 논문은 지속적 행동 평가(Continual-AQA) 문제를 다룬다. 기존 AQA 방법들은 모든 학습 데이터가 한 번에 주어진다고 가정하지만, 실제로는 새로운 기술 동작을 평가하는 능력이 지속적으로 요구된다.
저자들은 지속적 학습 문제에서 핵심은 과제 일관성 점수 차별화 특징 분포를 순차적으로 학습하는 것이라고 주장한다. 이를 위해 두 가지 접근법을 제안한다:
Feature-Score Correlation-Aware Rehearsal (FSCAR):
대표적인 과거 데이터 샘플링을 위한 Grouping Sampling 전략
과거 데이터의 특징과 점수를 함께 증강하는 Feature-Score co-Augmentation
과거와 현재 데이터의 특징 정렬을 위한 차이 모델링 기반 손실 함수
Action General-Specific Graph (AGSG):
과제 간 일반적 지식과 특정 지식을 분리하여 모델링
일반 그래프와 특정 그래프를 통해 과제 일관성 특징 추출 강화
실험 결과, 제안 방법은 기존 지속적 학습 방법 및 AQA 방법 대비 우수한 성능을 보였다. 특히 과제 간 도메인 차이가 큰 경우에도 효과적으로 망각을 완화할 수 있음을 확인하였다.
統計資料
지속적 학습 시 첫 번째 과제 성능이 0.9574에서 0.8194로 떨어짐
지속적 학습 후 첫 번째 과제 성능이 0.9574에서 0.8405로 떨어짐
引述
"지속적 학습 문제에서 핵심은 과제 일관성 점수 차별화 특징 분포를 순차적으로 학습하는 것이다."
"기존 AQA 방법들은 모든 학습 데이터가 한 번에 주어진다고 가정하지만, 실제로는 새로운 기술 동작을 평가하는 능력이 지속적으로 요구된다."