大規模言語モデルは、事前学習中に見られた世界の知識を保持できますが、この知識は時代遅れになりやすく、更新が難しいです。さらに、これらのモデルはしばしば時間的な不一致の下で使用され、過去に収集されたデータから訓練されているにもかかわらず、現在の質問に回答するよう求められます。この記事では、事実の持続時間予測というアプローチを提案し、迅速な変化が起こりやすい事実を特定することがモデルが時代遅れ情報を引用することを回避し、最新情報源を探索する必要性を決定するのに役立つことを示しています。また、事実の持続時間モデリングが知識密度タスク(例:オープン検索質問応答)のキャリブレーション向上にどう影響するかも示しています。
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Michael J.Q.... a las arxiv.org 03-06-2024
https://arxiv.org/pdf/2305.14824.pdfConsultas más profundas