本論文は、大規模事前学習モデルの効率的な微調整手法を提案している。従来の手法では多数の微調整済みモデルを平均化する必要があったが、本手法では2つの微調整済みモデルのみを用いて、同等以上の性能を達成できる。
具体的には以下の知見に基づいて手法を構築している:
提案手法「Model Stock」は、この知見に基づいて事前学習モデルと2つの微調整済みモデルの重みを組み合わせることで、高精度かつロバストな性能を実現する。実験の結果、従来手法と比べて大幅に少ない計算コストで同等以上の性能を達成できることを示している。
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Dong-Hwan Ja... lúc arxiv.org 03-29-2024
https://arxiv.org/pdf/2403.19522.pdfYêu cầu sâu hơn