Download Linnk AI
•
Autonomous Research Assistant
>
Sign In
insight
-
VLM-RM
ビジョン言語モデルは強化学習のためのゼロショット報酬モデルである
ビジョン言語モデルを使用して、強化学習タスクの報酬関数を指定する効果的な方法を提案しました。
1