본 논문에서는 음료 제조 산업 환경에서 실시간 기계 고장 예측을 위한 새로운 데이터 기반 솔루션인 TQRNN(Transformer Quantile Regression Neural Networks)을 소개합니다. TQRNN은 센서 데이터, 분위수 회귀 신경망, 트랜스포머 네트워크를 활용하여 최대 1시간 전에 기계 고장을 예측하여 생산 중단을 최소화하고 결함 있는 제품 생산을 방지합니다.
AI 에이전트가 단기간에 특정 머신러닝 연구 작업에서 인간 전문가를 능가하는 성과를 보여주지만, 장기간에 걸쳐 복잡한 AI 연구 개발을 완전히 자동화하기에는 아직 한계가 존재한다.
본 논문에서는 상태별 제약 조건이 있는 안전 다중 에이전트 강화 학습 (MARL)을 위한 새로운 이론적 프레임워크를 제안하며, 이는 제어 불변 집합 (CIS)을 활용하여 안전성과 성능 사이의 최적 균형을 달성하고 일반화된 내쉬 균형으로의 수렴을 보장합니다.
본 논문에서는 딥러닝 모델의 해석 불가능성을 극복하고자 자유 에너지 원리를 기반으로 하는 능동 추론 모델인 FEPS를 제안하고, 이를 통해 에이전트가 부분적으로 관찰 가능한 환경에서도 효과적으로 작업을 수행하고 학습할 수 있음을 보여줍니다.
본 논문에서는 지식 그래프 임베딩 모델의 학습 성능을 향상시키기 위해, 관계의 도메인 및 범위 정보를 활용하여 더욱 정확하고 효율적인 합성 부정 예제를 생성하는 새로운 방법을 제안합니다.
다중 모달 RLHF의 핵심 성공 요인은 거부된 응답에서 얻는 부정적 감독이며, 이를 활용한 새로운 nSFT 방식은 지속적인 SFT로도 RLHF와 동등한 성능을 달성할 수 있음을 보여줍니다.
기존의 궤적 표현 학습(TRL) 방법은 자유 공간에서의 움직임을 포착하는 그리드 궤적이나 도로 네트워크에서의 움직임을 포착하는 도로 궤적 중 하나만 사용하지만, 본 논문에서는 두 유형의 궤적이 상호 보완적인 정보를 제공한다는 점에 착안하여 그리드 및 도로 궤적 표현을 공동으로 활용하는 새로운 다중 모달 TRL 방법인 GREEN을 제안합니다.
본 논문에서는 데이터의 편향된 표현을 학습하는 기존 대조 학습 방법의 한계를 지적하고, 이를 개선하기 위해 어텐션 메커니즘을 활용한 새로운 공정 대조 학습 프레임워크를 제안합니다.
기존의 핫/콜드 데이터 식별 방법은 정확성 및 오버헤드 문제를 안고 있었으나, Hammer는 온라인 학습 전략을 기반으로 데이터 접근 패턴 변화에 동적으로 적응하여 정확성을 높이고 운영 비용을 절감하는 새로운 솔루션을 제시한다.
본 논문에서는 무선 충전 센서 네트워크(WRSN)에서 대상 범위 및 연결성을 보장하면서 네트워크 수명을 극대화하기 위해 다중 모바일 충전기의 충전 방식을 최적화하는 분산형 부분 관측 세미 마르코프 결정 프로세스(Dec-POSMDP) 모델 및 비동기 다중 에이전트 강화 학습 알고리즘(AMAPPO)을 제안합니다.