核心概念
大規模言語モデルを効果的に活用するための集合整列フレームワークを提案し、時系列イベントグラフの生成精度を向上させる。
要約
本研究では、時系列イベントグラフの生成を集合生成問題として捉え直し、大規模言語モデルの効果的な活用を目指したフレームワークを提案している。
従来の言語モデルによる系列生成アプローチでは、生成された系列の順序が正解と一致しないことで損失関数が高くなり、正しいエッジの生成が抑制されていた問題を指摘している。
そこで、集合整列に関する正則化項を導入し、順序に依存しない集合生成を行うフレームワークを提案した。
具体的には、生成された集合と正解集合の類似度を表すハウスドルフ距離に基づく正則化項、生成エッジ数の適切性を表す正則化項、重複エッジの抑制を表す正則化項を組み合わせている。
さらに、正解系列の順列を用いたデータ拡張も行っている。
提案手法は、既存の時系列イベントグラフ生成手法に比べて、より多くのエッジを生成できることを示しており、ゼロショット設定でも優れた一般化性を発揮することを確認している。
統計
提案手法は、既存の手法に比べて24%から48%多くのエッジを生成できる。
提案手法のエッジ再現率は、ベースラインに比べて7.5ポイント向上した。
引用
"大規模言語モデルを効果的に活用するための集合整列フレームワークを提案し、時系列イベントグラフの生成精度を向上させる。"
"提案手法は、既存の手法に比べて24%から48%多くのエッジを生成できる。"