本研究では、LLMによる要約プロセスを視覚的ワークスペースを用いて支援する手法を提案している。
視覚的ワークスペースには以下の2つの主要な機能がある:
外部メモリ機能: 分析者がワークスペースに認知プロセスを外在化し、後に素早く視覚的に参照できるようにする。
意味層機能: 分析者が構造情報を追加し、合成を支援する。
本研究では、この視覚的ワークスペースをLLMの要約プロセスに組み込むことで、要約の精度向上を図る。具体的には、ワークスペースから4つのタイプの情報(テキストレベル、洞察レベル、構造レベル、接続情報)を抽出し、LLMのプロンプトに組み込む。
実験の結果、ワークスペースの情報を活用することで、LLMによる要約結果がグラウンドトゥルースに大幅に近づくことが示された。特に、フィルタリングと clustering 情報が最も効果的であり、クラスター名の追加も精度向上に寄与した。
このように、視覚的ワークスペースはLLMの要約プロセスを効果的に支援する重要な中間ステップとなる可能性が示された。ヒトとAIの協調作業における重要なメディアとしての役割が期待できる。
翻譯成其他語言
從原文內容
arxiv.org
深入探究