Conceptos Básicos
本研究では、手書き文字認識のためのソースフリーの教師なし領域適応手法「アラインメント、最小化、多様化(AMD)」を提案する。このフレームワークは、事前学習済みの深層学習モデルを、ラベル付きのソースデータを必要とせずに、ターゲットドメインの画像のみを使って適応させることができる。
Resumen
本研究では、手書き文字認識(HTR)のためのソースフリーの教師なし領域適応手法「アラインメント、最小化、多様化(AMD)」を提案している。
AMD は以下の3つの正則化項から成る:
アラインメント項(La):ソースデータとターゲットデータの特徴分布の差異を減らすことで、事前学習した表現の転移可能性を高める。
最小化項(Lm):出力の不確実性を最小化し、ワンホットベクトルに近づけることで、確信度の高い予測を行う。
多様化項(Ld):ターゲットデータ全体で多様な系列を生成することで、情報の崩壊を防ぐ。
実験では、16種類のソースとターゲットの組み合わせについて評価を行った。その結果、AMD は全ての場合において従来手法を上回る性能を示し、特に合成データを使った場合に顕著な改善が見られた。
Estadísticas
手書き文字認識タスクでは、文字誤り率(CER)が50%以上から20%台まで改善された。
単一ソースの場合、IAMデータセットを使った場合に最大63%の誤り率低減が得られた。
合成データを使った場合、CERが30%以上低減された。
Citas
"本研究では、事前学習済みのHTRモデルを、ラベル付きのソースデータを必要とせずに、ターゲットドメインの画像のみを使って適応させることができる。"
"AMD は以下の3つの正則化項から成る: (1) アラインメント項、(2) 最小化項、(3) 多様化項。"
"実験の結果、AMD は全ての場合において従来手法を上回る性能を示し、特に合成データを使った場合に顕著な改善が見られた。"