대규모 언어 모델을 활용하여 생성한 동료 클래스 정보를 보조 모달리티로 사용하여 분포 외 데이터 탐지 성능을 향상시킬 수 있다.
대규모 고해상도 데이터셋을 효율적으로 압축하여 다양성과 현실성을 모두 보장하는 새로운 데이터 증류 방법을 제안한다.
예시 없는 지속적 학습에서 발생하는 가소성과 안정성의 딜레마를 해결하기 위해, 플라스틱 학습자와 안정적 학습자로 구성된 이중 학습자 모델을 제안하고, 누적 매개변수 평균 기법을 통해 두 학습자 간 지식 전달을 수행한다.
부분 레이블 문제로 인한 과도한 자신감 출력 분포를 최대 엔트로피 정규화를 통해 보정하고, 클래스 간 관계를 학습하는 클래스 증분 그래프 합성곱 신경망을 통해 레이블 관계를 보정한다.
다중 모달 대조 학습(MMCL)은 단일 모달 지도 학습(SL)에 비해 분포 변화에 강건한 표현을 학습할 수 있다. 이는 MMCL의 두 가지 핵심 메커니즘 때문이다: (1) 동일 클래스 내 대조를 통한 일반화 가능한 특징 학습, (2) 클래스 간 특징 공유를 통한 과도한 상관관계 극복.
다중 모달 대조 학습(MMCL)은 단일 모달 지도 학습(SL)에 비해 분포 변화에 더 강건한 표현을 학습할 수 있다. 이는 MMCL의 두 가지 메커니즘 때문이다: 1) 동일 클래스 내 대조를 통한 일반화 가능한 특징 학습, 2) 클래스 간 특징 공유를 통한 과도한 상관관계 극복.
회전 데이터 증강과 지식 증류를 결합한 새로운 클래스 증분 학습 기법인 RAD가 기존 방법들보다 우수한 성능을 보인다.
SETA는 토큰 수준에서 에지 정보를 선별하고 교란하여 모델의 형상 정보 학습을 향상시킴으로써 도메인 일반화 성능을 높인다.
약한 레이블을 활용하여 다중 시점 비디오 기반 모델을 학습하고, 이를 통해 프레임 수준의 인식 작업을 수행하는 새로운 프레임워크를 제안한다.
신경형태학적 하드웨어와 엣지 AI 가속기를 이용한 실시간 얼굴 표정 인식 시스템의 성능 비교 및 분석