長尾認識分野では、Decoupled Trainingパラダイムが注目されており、我々はLogits MagnitudeとRegularized Standard Deviationという新しいメトリクスを導入しました。これらのメトリクスを使用して、直接的な最適化目標を設定することで、小さくバランスの取れた絶対的なLogits Magnitudeを実現する単純なロジットリターゲティングアプローチ(LORT)がSOTAのパフォーマンスを達成しました。
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Han Lu,Siyu ... at arxiv.org 03-04-2024
https://arxiv.org/pdf/2403.00250.pdfDeeper Inquiries