本研究では、大規模言語モデルの虚偽生成問題に取り組む。具体的には以下の3つのアプローチを提案している。
プロキシモデルによる虚偽検出: 対話文と要約を入力として、各トークンの虚偽タグを予測するモデルを構築する。これにより、虚偽の種類を詳細に把握できる。
大規模言語モデルの実験: GPT-4やLLaMa 2などの最新モデルを用いて、虚偽検出を意識した要約生成を行う。プロンプトチューニングにより、モデルの性能を向上させる。
要約生成と虚偽検出の統合モデル: 要約生成とトークンレベルの虚偽検出を同時に行うエンドツーエンドのモデルを提案する。これにより、より整合性の高い出力が得られる。
これらの取り組みにより、大規模言語モデルの虚偽生成問題に対処し、信頼性の高い要約生成を実現することが期待される。
לשפה אחרת
מתוכן המקור
arxiv.org
תובנות מפתח מזוקקות מ:
by Priyesh Vakh... ב- arxiv.org 04-04-2024
https://arxiv.org/pdf/2312.14346.pdfשאלות מעמיקות