本論文は、テーブル認識のための注釈付きデータを合成する新しい手法を提案している。この手法は、既存の複雑なテーブルの構造とコンテンツを利用することで、対象ドメインの実際のテーブルスタイルに非常によく似たテーブルを効率的に合成することができる。
まず、対象ドメインのテーブルの実際の分布を詳細に調査・分析し、各カテゴリのテーブルスタイルプロファイルを抽出する。次に、既存のテーブルの構造とコンテンツを利用して、対応するカテゴリのスタイルプロファイルを適用することで、新しいターゲットテーブルを合成する。
この手法を中国の金融報告書ドメインに適用し、初の大規模なテーブル注釈データセットを合成した。さらに、この合成データを使ってテーブル認識モデルを訓練し、中国の金融報告書ドメインの実際の複雑なテーブルに対するベンチマークを作成した。実験結果は、提案手法の実用性と有効性を実証している。
また、この手法をEnglish金融報告書データセットFinTabNetに適用し、より複雑なテーブルの割合を増やすことで、テーブル認識モデルの性能を大幅に向上させることができた。
Naar een andere taal
vanuit de broninhoud
arxiv.org
Belangrijkste Inzichten Gedestilleerd Uit
by Qiyu Hou,Jun... om arxiv.org 04-18-2024
https://arxiv.org/pdf/2404.11100.pdfDiepere vragen