核心概念
本論文は、ドメイン固有のパラメータと出力層を持つ単一のコアモデルを提案し、プロンプトチューニングとアダプターを活用することで、限られたリソースでも優れた性能を発揮できる新しいアプローチを示している。
要約
本論文は、テキストの量と多様性の急速な拡大に伴う多ドメイン設定での課題に取り組んでいる。従来のアプローチでは、単一のモデルでは多様なドメインの微妙な違いを捉えきれず、一方で個別のモデルを使うと計算リソースの制約から現実的ではない。
そこで本論文では、コアモデルに複数のドメイン固有のパラメータと出力層を追加する新しいアプローチを提案している。プロンプトチューニングとアダプターを組み合わせることで、ドメイン毎に最適化された性能を発揮できる。
実験では、正式/非正式のデータセットと、ノイズが多く異なるドメインが混在するParsNERデータセットを使って評価を行っている。その結果、提案手法は既存の実用的なモデルを大きく上回る性能を示し、ドメインを問わず優れた結果を達成できることが確認された。
さらに、ドメインが未知の場合でも、文書ベースのドメイン検出パイプラインを提案し、提案手法の適応性と実用性を高めている。
統計
異なるドメインのデータサイズが大きく異なり、これが大きな課題となっている。
正式/非正式データセットでは21種類のエンティティタイプがあるのに対し、ParsNERデータセットでは9種類のタグしかない。
引用
"単一のモデルでは多様なドメインの微妙な違いを捉えきれず、一方で個別のモデルを使うと計算リソースの制約から現実的ではない。"
"提案手法は既存の実用的なモデルを大きく上回る性能を示し、ドメインを問わず優れた結果を達成できる。"