本研究では、ネパール語とベンガル語の文字認識のためのモデルを提案しています。両言語の手書きおよび印刷テキストを含む画像をトレーニングデータとして使用しました。実験結果によると、提案モデルはトレーニング時に文字誤り率(CER)とワード誤り率(WER)が低く、テストセットでも高い性能を発揮しました。
トレーニング時、ベンガル語とネパール語のCERはそれぞれ0.04と0.09、WERはそれぞれ0.10と0.14でした。テストセットでは、ベンガル語のCERと WERが平均0.07と0.12、ネパール語のCERとWERが平均0.11と0.15でした。これらの結果は、提案モデルがベンガル語とネパール語の文字を高精度に認識できることを示しています。
CERとWERが低く、テストセットでも高い性能を発揮したことから、本モデルは文書のデジタル化やテキスト抽出などの実用的な用途に適しています。提案の光学文字認識手法は、複雑で多様な入力画像からベンガル語とネパール語のテキストを正確に識別する能力を示しており、実用性が高いことがわかります。
Till ett annat språk
från källinnehåll
arxiv.org
Djupare frågor