本研究では、大規模言語モデルを活用したテキストデータ拡張の新しいフレームワーク「Self-LLMDA」を提案している。従来の手動による拡張手法では、品質と一貫性の問題があったが、Self-LLMDA では以下の2つの特徴により、これらの課題を解決している。
拡張手法の自動生成: 大規模言語モデルを使って、多様な拡張手法を自動的に生成する。これにより、手動で設計する必要がなくなり、スケーラビリティと一貫性が向上する。
タスク特化の手法選択: 生成された拡張手法の中から、各タスクに最適な手法を自動的に選択する。これにより、タスクに合わせた高品質な拡張データを生成できる。
実験では、26種類の少量学習タスクを対象に評価を行い、Self-LLMDA が従来手法を大きく上回る性能を示すことを確認した。さらに、未知の拡張手法や未知のターゲットモデルに対しても高い汎化性を持つことが分かった。
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Yichuan Li,K... at arxiv.org 04-30-2024
https://arxiv.org/pdf/2404.17642.pdfDeeper Inquiries