本研究では、大規模言語モデルの生成テキストに対して、出典情報を文レベルで付与する手法を提案している。従来の手法では、生成テキスト全体に対して文書レベルの出典情報が付与されていたが、本手法では各文に対応する出典情報の抽出を行う。
具体的には、以下の3つのステップから成る:
これにより、生成テキストの各文に対して、その根拠となる入力文書の該当箇所が明示される。
実験の結果、従来手法と比べて出典情報の長さが大幅に短縮されつつ、生成テキストの品質も維持または向上することが示された。また、人手評価では出典情報の確認作業の時間が約半分に短縮されることが確認された。
本手法は、大規模言語モデルの生成テキストの信頼性向上に寄与すると期待される。今後は、本手法の他のタスクへの適用や、出典情報の抽出精度の向上などが課題として考えられる。
To Another Language
from source content
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Aviv Slobodk... lúc arxiv.org 03-27-2024
https://arxiv.org/pdf/2403.17104.pdfYêu cầu sâu hơn