Khái niệm cốt lõi
본 논문은 다중 작업 밀집 예측을 위한 새로운 디코더 기반 방법인 저차원 전문가 혼합(MLoRE) 기법을 제안한다. MLoRE는 전문가 간 전역적 관계를 명시적으로 모델링하고, 전문가 수를 늘려 표현 능력을 확장하면서도 계산 비용을 효과적으로 제어한다.
Tóm tắt
본 논문은 다중 작업 밀집 예측을 위한 새로운 디코더 기반 방법인 MLoRE를 제안한다.
- 기존 전문가 혼합(MoE) 기반 방법은 전역적 작업 관계 모델링을 간과하고, 전문가 수 증가에 따른 매개변수 및 계산 비용 증가 문제가 있다.
- MLoRE는 이를 해결하기 위해 다음과 같은 핵심 기능을 제공한다:
- 작업 간 전역적 관계를 명시적으로 모델링하는 범용 컨볼루션 경로 추가
- 저차원 형식의 전문가 네트워크 도입으로 매개변수 및 계산 비용 절감
- 선형 전문가 네트워크와 재매개변수화를 통한 추론 효율 향상
- 실험 결과, MLoRE는 PASCAL-Context와 NYUDv2 데이터셋에서 기존 최신 방법 대비 모든 지표에서 우수한 성능을 달성했다.
Thống kê
본 논문의 MLoRE 모듈은 기존 MoE 대비 매개변수와 FLOPs를 60% 이상 절감할 수 있다.
전문가 수를 15개로 늘리면 다중 작업 학습 성능이 가장 우수하다.
각 작업별로 전체 전문가의 60%를 활성화하는 것이 최적의 성능을 보인다.
Trích dẫn
"이전 다중 작업 밀집 예측 방법들은 모든 작업 간 전역적 관계 모델링의 중요성을 간과했다."
"전문가 수를 늘리면 표현 능력을 확장할 수 있지만, 기존 방법에서는 매개변수와 계산 비용도 함께 증가하는 문제가 있다."