本研究では、大規模言語モデルを活用したテキストデータ拡張の新しいフレームワーク「Self-LLMDA」を提案している。従来の手動による拡張手法では、品質と一貫性の問題があったが、Self-LLMDA では以下の2つの特徴により、これらの課題を解決している。
拡張手法の自動生成: 大規模言語モデルを使って、多様な拡張手法を自動的に生成する。これにより、手動で設計する必要がなくなり、スケーラビリティと一貫性が向上する。
タスク特化の手法選択: 生成された拡張手法の中から、各タスクに最適な手法を自動的に選択する。これにより、タスクに合わせた高品質な拡張データを生成できる。
実験では、26種類の少量学習タスクを対象に評価を行い、Self-LLMDA が従来手法を大きく上回る性能を示すことを確認した。さらに、未知の拡張手法や未知のターゲットモデルに対しても高い汎化性を持つことが分かった。
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問