本論文は、テキストの量と多様性の急速な拡大に伴う多ドメイン設定での課題に取り組んでいる。従来のアプローチでは、単一のモデルでは多様なドメインの微妙な違いを捉えきれず、一方で個別のモデルを使うと計算リソースの制約から現実的ではない。
そこで本論文では、コアモデルに複数のドメイン固有のパラメータと出力層を追加する新しいアプローチを提案している。プロンプトチューニングとアダプターを組み合わせることで、ドメイン毎に最適化された性能を発揮できる。
実験では、正式/非正式のデータセットと、ノイズが多く異なるドメインが混在するParsNERデータセットを使って評価を行っている。その結果、提案手法は既存の実用的なモデルを大きく上回る性能を示し、ドメインを問わず優れた結果を達成できることが確認された。
さらに、ドメインが未知の場合でも、文書ベースのドメイン検出パイプラインを提案し、提案手法の適応性と実用性を高めている。
إلى لغة أخرى
من محتوى المصدر
arxiv.org
الرؤى الأساسية المستخلصة من
by Parham Abed ... في arxiv.org 04-04-2024
https://arxiv.org/pdf/2404.02335.pdfاستفسارات أعمق