Kernkonzepte
LLMベースの多ラベル分類器をターゲットドメインに適応させるための新しい半教師あり手法「DALLMi」を提案する。DALLMiは、ラベル付きデータが限定的な場合でも、ラベル付きデータと非ラベル付きデータを効果的に活用することで、ドメイン適応の性能を向上させる。
Zusammenfassung
本研究では、LLMベースの多ラベル分類器をターゲットドメインに適応させるための新しい半教師あり手法「DALLMi」を提案している。
DALLMiの主な特徴は以下の通り:
- ラベル付きデータと非ラベル付きデータを組み合わせた変分損失関数を導入し、限定的なラベル付きデータを有効活用する。
- ラベル付きデータと非ラベル付きデータの線形補間により新しい合成サンプルを生成し、モデルの正則化を行う。
- ラベルごとにバランスの取れたサンプリング手法を採用し、各ラベルの情報を均等に学習できるようにする。
提案手法を3つのデータセットで評価した結果、従来の部分教師あり手法や教師なし手法と比べて、平均精度(mAP)が19.9%および52.2%向上することを示した。特に、ラベル付きデータが限定的な場合でも、DALLMiは高い性能を発揮することが確認された。
Statistiken
ラベル付きデータが50%しかない場合、DALLMiは従来の部分教師あり手法と比べて、PubMedデータセットで58.9%、arXivデータセットで24.5%、Moviesデータセットで26.5%のmAP精度を達成した。
ラベル付きデータが30%しかない場合、DALLMiは従来の部分教師あり手法と比べて、PubMedデータセットで58.2%、arXivデータセットで23.2%、Moviesデータセットで26.2%のmAP精度を達成した。
ラベル付きデータが10%しかない場合、DALLMiは従来の部分教師あり手法と比べて、PubMedデータセットで52.2%、arXivデータセットで20.5%、Moviesデータセットで26.0%のmAP精度を達成した。
Zitate
「DALLMiは、ラベル付きデータが限定的な場合でも、ラベル付きデータと非ラベル付きデータを効果的に活用することで、ドメイン適応の性能を向上させる」
「DALLMiの変分損失関数と合成サンプルによる正則化手法は、従来の部分教師あり手法や教師なし手法と比べて、優れた性能を発揮する」
「ラベルごとにバランスの取れたサンプリング手法は、各ラベルの情報を均等に学習できるようにする」