Download Linnk AI
•
Autonomous Research Assistant
>
Sign In
insight
-
프로그램 합성을 위한 가치 기반 심층 강화 학습
프로그램 합성을 위한 가치 기반 심층 강화 학습: B-Coder
프로그램 합성 작업에서 가치 기반 강화 학습 방법론의 실현 가능성을 탐구하고, 이를 위해 Q-함수 초기화 및 보수적 벨만 연산자를 도입하여 학습 안정성과 효율성을 높였다.
1