Last ned Linnk AI
•
Forskningsassistent
>
Logg Inn
innsikt
-
カスタム環境における多目的強化学習のための報酬関数設計
大規模言語モデルを用いた、カスタム環境における多目的強化学習のための効率的な報酬関数探索
大規模言語モデルを活用して、カスタム環境における多目的強化学習課題の報酬関数を効率的に設計・最適化する手法を提案する。
1