本研究では、ユニバーサルドメイン一般化を実現するための新しい手法「UNIGEN」を提案している。UNIGEN は、ドメイン固有のプロンプトではなく、ドメイン非依存のプロンプトを使用してデータセットを生成する。これにより、生成されたデータセットはドメイン間の一般化が可能となる。さらに、擬似ラベリングと記憶バンクの除雑音化を組み合わせることで、生成されたデータの品質を向上させている。
実験の結果、UNIGEN は単一のモデルで様々なドメインに対して一般化できることが示された。また、大規模言語モデルと比較して桁違いに少ないパラメータ数で、ドメイン間の一般化性能を維持できることが確認された。これにより、大規模言語モデルを直接使用するよりも効率的な推論が可能となる。
In eine andere Sprache
aus dem Quellinhalt
arxiv.org
Wichtige Erkenntnisse aus
by Juhwan Choi,... um arxiv.org 05-03-2024
https://arxiv.org/pdf/2405.01022.pdfTiefere Fragen