核心概念
単一の線形層は、タスク適応型の低ランク行列を生成する。
统计
モデルファインチューニング時に使用されたハイパーパラメータ:
バッチサイズ:16
最適化アルゴリズム:Adam
スケジューラ:Linear
ターゲットモジュール:{query, value}
ターゲットレイヤー:{1, 2, ..., 12}
LoRA r:8
LoRA α:8
最大シーケンス長:512
引用
"CondLoRAは、訓練可能パラメータ数が少なくなりながらも、既存のParameter-Efficient Fine-tuning手法であるLoRAと同等以上のパフォーマンスを発揮します。"