Core Concepts
自然言語処理モデルの高信頼度の誤分類を軽減するために、人間またはLLMを用いて既存の誤分類事例を一般化し、それに基づいて合成データを生成する。
Abstract
本研究では、自然言語処理(NLP)モデルの高信頼度の誤分類を軽減するために、人間またはLLM(大規模言語モデル)を用いて既存の誤分類事例を一般化し、それに基づいて合成データを生成する手法を提案している。
まず、人間またはLLMに既存の誤分類事例を提示し、その原因を説明する仮説を生成させる。次に、その仮説に基づいて新たな合成サンプルを生成する。最後に、この合成データを元のトレーニングデータに追加し、モデルを再学習することで、高信頼度の誤分類を軽減する。
実験の結果、提案手法は分類精度を維持しつつ、高信頼度の誤分類を大幅に削減することができた。また、LLMを用いた場合の方が人間を用いた場合よりも、より一貫して高い性能が得られることが示された。さらに、LLMを用いる方が人間を用いるよりもコストが大幅に低いことも明らかになった。
Stats
高信頼度の誤分類が全体の56.09%減少した。
LLMを用いた場合の平均的な高信頼度の誤分類の減少率は19.54%であり、人間を用いた場合の16.80%を上回った。
Quotes
"高信頼度の誤分類を軽減するために、人間またはLLMを用いて既存の誤分類事例を一般化し、それに基づいて合成データを生成する。"
"提案手法は分類精度を維持しつつ、高信頼度の誤分類を大幅に削減することができた。"
"LLMを用いた場合の方が人間を用いた場合よりも、より一貫して高い性能が得られることが示された。"