Core Concepts
視覚的に豊かな文書における関係抽出タスクを、追加の事前学習なしで、パラメータ数を減らしつつ、現状最高レベルの性能に匹敵する手法を提案する。
Abstract
本研究では、LayoutLMv3をバックボーンとした関係抽出モデルを提案している。追加の事前学習を必要とせず、パラメータ数も減らしつつ、FUNSD及びCORDデータセットにおいて、現状最高レベルの性能を達成または上回ることができた。
主な貢献は以下の通り:
追加の幾何学的事前学習なしで、現状最高レベルの性能を達成する手法を提案した。
関係抽出モデルの性能に影響を与える要因について、詳細な分析を行った。具体的には、エンティティタイプ情報の活用、レイアウト情報の活用、エンティティの順序情報の活用などの効果を検証した。
分析の結果、エンティティタイプ情報の活用とレイアウト情報の適切な活用が性能向上に大きく寄与することが分かった。一方で、エンティティの順序情報への過度の依存は避けるべきであり、レイアウト情報を直接活用することが重要であることが示唆された。
Stats
文書内のエンティティ間の関係を表す行列の予測精度は、FUNSDデータセットで90.81%、CORDデータセットで98.48%に達した。
レイアウト情報の活用と、エンティティタイプ情報の活用が、関係抽出の性能向上に大きく寄与した。
Quotes
"視覚的に豊かな文書における関係抽出タスクは、複雑な非構造化文書からの価値ある洞察を抽出する上で重要である。"
"本研究では、追加の事前学習なしで、パラメータ数を減らしつつ、現状最高レベルの性能を達成する手法を提案した。"