大規模言語モデルは、事前学習中に見られた世界の知識を保持できますが、この知識は時代遅れになりやすく、更新が難しいです。さらに、これらのモデルはしばしば時間的な不一致の下で使用され、過去に収集されたデータから訓練されているにもかかわらず、現在の質問に回答するよう求められます。この記事では、事実の持続時間予測というアプローチを提案し、迅速な変化が起こりやすい事実を特定することがモデルが時代遅れ情報を引用することを回避し、最新情報源を探索する必要性を決定するのに役立つことを示しています。また、事実の持続時間モデリングが知識密度タスク(例:オープン検索質問応答)のキャリブレーション向上にどう影響するかも示しています。
Başka Bir Dile
kaynak içeriğinden
arxiv.org
Önemli Bilgiler Şuradan Elde Edildi
by Michael J.Q.... : arxiv.org 03-06-2024
https://arxiv.org/pdf/2305.14824.pdfDaha Derin Sorular