מושגי ליבה
本手法は、限定的なラベル付きデータを活用し、教師モデルと学生モデルの相互更新を通じて、効率的かつ正確なテーブル検出を実現する。
תקציר
本研究では、ラベル付きデータが限定的な状況でのドキュメントオブジェクト(テーブルやテキスト)の正確かつ効率的な検出に取り組む。この手法では、教師モデルと学生モデルのネットワークを活用し、相互に更新しながら学習を行う。従来の変換器ベースの研究では、注意機構の改善や提案オブジェクトの増加に焦点を当ててきたが、これらはトレーニング時間とパフォーマンスに影響を与えていた。
本手法では、Non-Maximal Suppression(NMS)を必要とせず、オブジェクトクエリーと画像特徴の照合に焦点を当てる。SAM-DETRを半教師あり学習に適用する新しいアプローチにより、オブジェクトクエリーとターゲット特徴の整合性を高め、複雑なレイアウトのドキュメントにおけるオブジェクト検出の精度を大幅に向上させることができる。
全体として、本手法は限定的なラベル付きデータを活用しつつ、ドキュメント分析の精度を向上させることができる。
סטטיסטיקה
提案手法は、PubLayNetデータセットの10%のラベル付きデータを使用して、mAP 89.9%を達成した。
TableBankデータセットの10%のラベル付きデータを使用して、mAP 92.7%を達成した。
PubTablesデータセットの10%のラベル付きデータを使用して、mAP 92.3%を達成した。
ציטוטים
"本手法は、限定的なラベル付きデータを活用し、教師モデルと学生モデルの相互更新を通じて、効率的かつ正確なテーブル検出を実現する。"
"SAM-DETRを半教師あり学習に適用する新しいアプローチにより、オブジェクトクエリーとターゲット特徴の整合性を高め、複雑なレイアウトのドキュメントにおけるオブジェクト検出の精度を大幅に向上させることができる。"