核心概念
スマートフォンで複数ページの文書を効率的かつ自動的にスキャンするための、堅牢なオンデバイス深層学習モデルとその開発プロセスを紹介する。
要約
モバイル文書スキャンにおける新たなアプローチ
本稿は、スマートフォンを用いた複数ページ文書のスキャンを自動化する、堅牢なオンデバイス深層学習モデルとその開発プロセスを解説する研究論文である。
スマートフォンカメラは、手軽な文書デジタル化ツールとして普及している。しかし、複数ページの文書をデジタル化する場合は、専用スキャナーに比べて時間がかかり、煩雑になる。既存の自動化手法は、スマートフォンを三脚に固定するなど、制約が多い。
本研究は、ユーザーが文書をめくりながら動画を撮影するだけで、複数ページの文書を自動的にスキャンできる、より実用的な手法の開発を目的とする。