본 논문에서는 사전 훈련된 컴퓨터 비전 모델(SAM)을 퓨샷 학습 설정에서 새로운 작업(다중 클래스 의미론적 분할)에 적용하기 위해 그래디언트 학습 없이 자동화된 프롬프트 생성을 활용하는 방법을 제안합니다.
본 논문에서는 퓨샷 액션 인식을 위해 비디오 레벨에서 태스크 레벨까지 시공간적 관계를 학습하는 새로운 듀얼 모션 기반 어텐션 학습(DMGAL) 방법을 제안합니다.
사전 훈련된 생성 모델을 활용하여 새로운 작업 개념을 효율적으로 학습하고, 이를 통해 다양한 작업 수행 능력을 향상시키는 퓨샷 작업 학습 방법론 제시
표 형식 데이터의 퓨샷 학습에서 대규모 언어 모델(LLM)이 최근 주목받고 있지만, 그래디언트 부스팅 결정 트리(GBDT)의 성능을 향상시키면 여전히 경쟁력 있는 대안이 될 수 있으며, 특히 샘플 수가 증가함에 따라 GBDT가 훨씬 빠른 속도로 우수한 성능을 제공할 수 있다.
새로운 객체 인스턴스에 대한 배치를 예측하기 위해 몇 개의 데모에서 객체 배치를 학습하는 효율적인 방법을 제시합니다.
본 논문에서는 퓨샷 클래스 증분 학습(FSCIL)에서 발생하는 새로운 클래스에 대한 과적합 및 기존 클래스에 대한 치명적 망각 문제를 해결하기 위해 공분산 제약 손실과 의미론적 섭동 학습을 제안합니다.
본 연구는 소량의 라벨링된 데이터와 설명 가능한 AI를 활용하여 드론 이미지에서 침입종 및 외래종 나무를 효과적으로 감지하는 워크플로우를 제시합니다.
텍스트 레이블 및 2D 이미지 정보와 같은 멀티모달 정보를 활용하면 퓨샷 3D 포인트 클라우드 의미론적 분할 작업의 성능을 크게 향상시킬 수 있다.
이미지의 주파수 성분을 선택적으로 필터링하면 특징 맵의 채널 상관 관계를 줄이고 도메인 간 일반화를 향상시켜 교차 도메인 퓨샷 의미론적 분할 작업의 성능을 크게 향상시킬 수 있습니다.
본 논문에서는 다양한 기본 정책을 활용하여 새로운 움직임 궤적을 효율적으로 학습하는 퓨샷 학습 접근 방식인 DSE(Diffusion Score Equilibrium)를 제안합니다. DSE는 기본 정책의 확산 모델을 구성하고, 새로운 움직임 데모 데이터 분포와의 거리를 최소화하여 구성 가중치를 학습합니다. 또한, 로봇의 전체 움직임 궤적 분포 간의 거리를 측정하는 새로운 지표인 MMD-FK(Maximum Mean Discrepancy on the Forward Kinematics Kernel)를 제안합니다. 시뮬레이션 및 실제 로봇 실험을 통해 DSE가 기존 방법보다 우수한 성능을 보이며, 퓨샷 학습 환경에서 효과적으로 새로운 움직임을 학습할 수 있음을 입증합니다.