핵심 개념
본 논문에서는 서로 다른 작업 간의 지식 전이가 일부 작업의 성능을 향상시키는 동시에 다른 작업의 성능을 저해할 수 있는 비대칭적 작업 관계를 활용하는 새로운 다중 작업 학습 최적화 전략을 제안합니다.
초록
자기 보조를 활용한 다중 작업 학습에서 비대칭적 지식 전이 구현
본 연구는 다중 작업 학습(MTL)에서 작업 간의 지식 전이가 항상 대칭적인 것은 아니라는 점에 주목하고, 비대칭적인 작업 관계를 효과적으로 활용하는 새로운 최적화 전략을 제안하는 것을 목표로 합니다.
본 논문에서 제안하는 자기 보조 비대칭 학습(SAAL)은 작업의 복제본인 '자기 보조' 작업을 학습 과정에 도입하여 작업 간의 지식 전이를 비대칭적으로 제어합니다. 자기 보조 작업은 다른 작업의 작업 특정 모듈을 사용하여 예측을 수행함으로써, 특정 작업의 학습 신호가 다른 작업의 성능에 영향을 미치도록 유도합니다.
자기 보조 작업
자기 보조 작업은 원본 작업과 동일한 데이터, 레이블, 데이터 증강 및 기타 학습 설정을 사용하지만, 대상 작업과 동일한 인코더를 사용하여 대상 작업의 작업 특정 구성 요소로 지식을 전달합니다. 자기 보조 작업은 공유 인코더 내에서 공유 표현을 유연하게 학습하기 위해 독립적인 디코더를 사용합니다.
작업 관계 결정 전략
SAAL은 세 가지 전략을 통해 작업 관계를 결정하고, 이를 기반으로 학습 과정에 포함할 자기 보조 작업을 선택합니다.
열거 전략 (SAALe): 모든 작업 쌍에 대해 완전히 학습된 공유 하단 MTL 모델의 성능을 평가하여 작업 관계를 명확하게 설정합니다. 이 전략은 계산 비용이 많이 들지만, 명확한 작업 관계를 제공합니다.
손실 가중치 전략 (SAALw): 모델 학습 중에 주 작업과 보조 작업의 상대적 중요도를 나타내는 가중치를 학습합니다. 이 전략은 단일 학습 실행으로 작업 관계를 학습할 수 있지만, 지역적인 정보에 의존하기 때문에 신뢰성이 떨어질 수 있습니다.
결합 전략 (SAALew): 열거 전략과 손실 가중치 전략을 결합하여 두 가지 접근 방식의 이점을 모두 활용합니다.