Core Concepts
SGENetは、リソース制限されたプラットフォームでの展開を容易にするための効率的なフレームワークです。
Abstract
ABSTRACT:
シーンテキスト画像の超解像度は、シーンテキスト認識の精度を大幅に向上させています。
SGENetは、リソース制限されたプラットフォームでの展開を容易にする効率的なフレームワークです。
INTRODUCTION:
STISRは、現実世界からキャプチャされた低解像度のテキスト画像の品質と解像度を向上させることを目指しています。
STISR技術は、シーンテキスト認識やドキュメント分析などに重要です。
APPROACH:
SGENetには、超解像度ブランチと意味ガイダンスブランチが含まれています。
意味ガイダンスブランチでは、事前学習済みのテキスト認識器が使用されています。
EXPERIMENTS:
TextZoomデータセットで行われた実験では、SGENetが優れたパフォーマンスと効率性のバランスを達成しました。
SGENetは他のSTISR方法と比較しても優れた結果を示しました。
CONCLUSIONS:
SGENetはリソース制限されたデバイスで簡単に展開可能であり、優れたパフォーマンスと効率性のバランスを提供します。
Stats
この作業はサポートされました。中国国家档案局研究计划(2021-X-25)。
SGENetはLEMMAよりも85%計算複雑性が低いことが示されました。