本論文は、大規模言語モデル(LLM)の生成能力を活用して、少量のデータでも高精度なゼロショット文章分類モデルを構築する手法を提案している。
具体的には以下の2つの方法を提案している:
入力テキストに対してLLMを用いて複数の拡張テキストを生成し、それらの平均埋め込みを用いることで、擬似ラベル予測の精度を向上させる。
LLMを用いて、擬似ラベルに基づいて新しい訓練データを生成することで、擬似ラベルの誤りを軽減し、クラス間の境界を改善する。
これらの手法を組み合わせた提案手法「GenCo」は、従来手法と比較して、特に少量のデータしか利用できない状況でも高い性能を発揮することが示されている。理論的な分析により、提案手法がクラス間の分離を強化し、汎化性能の向上につながることが説明されている。
เป็นภาษาอื่น
จากเนื้อหาต้นฉบับ
arxiv.org
ข้อมูลเชิงลึกที่สำคัญจาก
by Ruohong Zhan... ที่ arxiv.org 04-16-2024
https://arxiv.org/pdf/2304.11872.pdfสอบถามเพิ่มเติม