SAFLEX는 기존 데이터 증강 기법의 노이즈 및 레이블 오류를 효과적으로 줄여 다양한 데이터 세트와 학습 작업에서 성능을 향상시키는 자기 적응형 증강 방법입니다.
로봇 데이터의 다운샘플링과 이미지 데이터를 활용한 새로운 데이터 증강 기법인 DABI를 통해, 적은 데모 데이터셋으로도 양방향 제어 기반 모방 학습의 성능을 향상시킬 수 있다.
본 논문에서는 일본어 특화 상식 도덕성 데이터셋인 JCM 데이터셋을 마스크 토큰 및 라벨 개선(MTLE) 기법을 활용하여 확장함으로써, 문화적 맥락을 고려한 AI 윤리 판단 모델 개발의 중요성을 강조하고 그 효과를 실험적으로 검증했습니다.
합성 오디오 데이터를 활용한 데이터 증강 기법을 통해 심장 청진 신호 분류 모델의 성능 및 강건성을 향상시킬 수 있다.
본 논문에서는 딥러닝 모델의 일반화 및 강건성을 향상시키기 위해 샘플별 암시적 반사실적 데이터 증강(ICDA) 방법을 제안합니다. 이 방법은 인과 관계가 없는 속성과 클래스 간의 잘못된 상관관계를 제거하여 모델이 안정적인 예측을 할 수 있도록 합니다.
본 논문에서는 데이터 증강 기법을 통해 지속적 강화 학습에서 발생하는 치명적 망각 문제를 완화하고, 새로운 작업에 대한 적응력과 일반화 성능을 향상시키는 방법을 제시합니다.
본 논문에서는 로봇 운동 제어와 같은 상태 기반 연속 제어 작업에서 유클리드 데이터 증강 기법을 사용하여 강화 학습의 데이터 효율성과 성능을 향상시키는 방법을 제시합니다.
대규모 언어 모델(LLM)을 활용하여 이미지 분류 작업에 효과적인 데이터 증강 정책을 자동으로 생성할 수 있으며, 이는 특히 의료 영상 데이터 세트와 같이 다양하고 특수한 데이터 세트에서 기존 방법보다 우수한 성능을 보인다.
본 논문에서는 현실적인 합성 객체 인스턴스를 생성하여 기존 비디오 데이터 세트에 통합하는 새로운 데이터 증강 기법인 SDI-Paste를 제안하며, 이를 통해 비디오 인스턴스 분할 작업의 성능을 향상시킵니다.
본 논문에서는 제한된 데이터 환경에서 합성 스토리 데이터를 활용한 언어 모델 사전 훈련의 효과를 연구하고, TinyStories 데이터셋과 GPT-Neo 모델을 사용하여 데이터 증강을 통해 언어 모델의 성능 향상 가능성을 실험적으로 검증했습니다.