본 논문에서는 높은 전자기적 충실도와 구조적 다양성을 가진 메타표면을 설계하기 위해 새로운 딥러닝 프레임워크인 AcGAN(Anchor-controlled Generative Adversarial Network)을 제안합니다. AcGAN은 스펙트럼 정확도를 정밀하게 평가하는 SOC(Spectral Overlap Coefficient)와 실시간 전자기 성능 피드백을 제공하는 AnchorNet을 통해 기존 GAN 모델의 한계를 극복하고, 원하는 스펙트럼 특성을 충족하면서도 다양한 구조를 가진 메타표면 설계를 가능하게 합니다.
랜덤 특징(RF)의 분산을 줄이기 위해 최적 전송(OT)을 활용한 새로운 프레임워크를 제시하며, 이는 유클리드 및 이산 입력 공간 모두에서 RF 커플링을 개선하여 기존 방법보다 뛰어난 성능을 달성합니다. 하지만, 단순한 분산 감소만으로는 성능 향상을 보장할 수 없으며, 특정 작업에 최적화된 OT 비용 함수를 신중하게 선택해야 함을 강조합니다.
본 논문에서는 변분 오토인코더(VAE)를 사용하여 현실적이고 불리한 상황을 생성하여 2단계 적응형 강건 최적화 문제를 해결하는 새로운 알고리즘인 AGRO를 제안합니다. AGRO는 기존 방법보다 계획 비용을 줄이면서도 더욱 강건한 초기 결정을 내릴 수 있도록 합니다.
본 논문에서는 장기 시계열 예측(LTSF)에서 순서 의존성, 의미 의존성, 교차 변수 의존성이라는 세 가지 중요한 의존성을 효과적으로 포착하는 새로운 모델인 SAMBA를 제안합니다. SAMBA는 기존 모델의 과적합 문제를 해결하고, 시간 및 변수 차원 간의 상호 간섭을 최소화하는 디커플링된 인코딩 전략을 통해 교차 변수 의존성을 효과적으로 활용합니다.
전력 시스템 데이터의 복잡한 계층적 구조와 시간적 의존성을 동시에 모델링하는 새로운 기반 모델 PowerPM을 소개합니다. PowerPM은 대규모 전력 시스템 데이터에 대한 사전 학습을 통해 다양한 다운스트림 작업에서 우수한 성능과 뛰어난 일반화 능력을 보여줍니다.
본 논문에서는 인간의 선호도를 더 잘 반영하기 위해, 기존의 보상 기반 강화 학습에서 벗어나 게임 이론적 관점에서 일반적인 선호도 프레임워크를 사용하여 대규모 언어 모델을 정렬하는 새로운 온라인 알고리즘인 INPO를 제안합니다.
사전 훈련된 언어 모델의 미세 조정은 레이블이 지정된 훈련 샘플 부족을 극복하는 데 도움이 되지만 모델 성능 불안정성을 보입니다. 본 논문에서는 앙상블, 노이즈 정규화 및 모델 보간의 강점을 활용하면서도 계산 효율성을 유지하는 새로운 완화 전략인 DENI(Delayed Ensemble with Noisy Interpolation)를 제안합니다.
제한된 데모 리소스를 효율적으로 활용하기 위해 에이전트가 학습 중 필요한 데모를 스스로 요청하는 에피소드 활성 강화 학습 방법론을 제시하고, 이를 통해 정책 학습 속도를 높이고 사용자 경험을 향상시킬 수 있다.
본 논문에서는 단일 에포크 및 대규모 배치를 사용하여 O(1)-Smooth DP-SCO에 대한 최적 비율을 달성하는 Accelerated-DP-SRGD 알고리즘을 제안합니다.
제한된 레이블 데이터 학습에서 무작위성 요소(예: 샘플 선택 또는 순서) 간의 상호 작용을 고려하지 않으면 성능 변동에 대한 잘못된 해석이 발생하여 일관성 없는 결과가 도출될 수 있습니다.