Linnk AIをダウンロード
•
AIリサーチアシスタント
>
サインイン
インサイト
-
正則化ベストオブNサンプリング
言語モデルの整合性を高めるための正則化ベストオブN サンプリング
報酬ハッキングを軽減するために、ベストオブN(BoN)サンプリングに近接正則化を導入した手法を提案する。
1