本論文は、大規模言語モデル(LLM)を使用したプロダクト属性値抽出(AVE)の可能性を探索している。ゼロショットおよびフューショットのプロンプトテンプレートを様々なLLMで評価し、最良のパフォーマンスはGPT-4が達成した(F1スコア85%)。LLMはスキーマ知識、属性の説明、デモンストレーションを組み込んだプロンプトを使うことで高精度な抽出が可能である。また、LLMはプリトレイン言語モデル(PLM)ベースの手法と比べて、同じ量のトレーニングデータでより高いF1スコアを達成し、未知の属性値に対しても頑健性が高い。GPT-4の性能は、オープンソースのLLMであるLlama-3-70Bとほぼ同等であり、後者は強力な代替案となる。さらに、GPT-3.5のファインチューニングにより、GPT-4と同等のパフォーマンスが得られるが、未知の属性値に対する一般化能力が低下する。
Vers une autre langue
à partir du contenu source
arxiv.org
Questions plus approfondies