本論文は、歴史的手稿の研究において、研究者がしばしば古代テキストに新規のシンボルに遭遇し、その識別と文書化に多大な努力を投じている問題に取り組む。既存のオブジェクト検出手法は既知のカテゴリでは優れた性能を発揮するが、再学習なしでは新規シンボルを認識することが困難である。
本手法は、Visually Guided Text Spotting (VGTS)アプローチを提案し、わずか1つの注釈付きサポート画像を使用して新規文字を正確にスポットする。VGTSの核心は、Dual Spatial Attention (DSA)ブロックとGeometric Matching (GM)ブロックから成る空間整列モジュールである。DSAブロックは、サポート画像とクエリ画像の判別的な空間領域を識別、焦点化、学習することを目的とする。GMブロックは、2つの画像間の空間対応関係を確立し、クエリ画像内のターゲット文字の正確な位置特定を可能にする。
また、低リソースのスポッティングタスクにおける例の不均衡問題に対処するため、距離メトリック学習の弁別力を高める新規のトーラス損失関数を開発した。さらに、中国のナシ少数民族に関連する古代ドンバ象形文字(DBH)の新規データセットを導入し、DBHデータセットおよび他の公開データセットEGY、VML-HD、TKH、NCでの広範な実験により、VGTSが常に最先端手法を上回ることを示した。提案フレームワークは、歴史的手稿テキストスポッティングへの適用において大きな可能性を示しており、研究者が最小限の注釈作業で新規シンボルを効率的に識別・文書化できるようにする。
To Another Language
from source content
arxiv.org
Önemli Bilgiler Şuradan Elde Edildi
by Wenbo Hu,Hon... : arxiv.org 04-01-2024
https://arxiv.org/pdf/2304.00746.pdfDaha Derin Sorular