Core Concepts
シングリッシュ単語を効率的にシンハラ語に変換するための新しいルールベースのアプローチを提案する。
Abstract
本研究では、シンハラ語への効率的なシングリッシュ変換システム「Swa Bhasha」を提案している。シンハラ語は低リソース言語であるため、シンハラ語への変換は非常に複雑で時間のかかる作業である。そのため、多くのスリランカ人がシンプルな変換を行うために非公式のテキスト言語「シングリッシュ」を使用している。
本システムは、ルールベースのアプローチと自然言語処理技術を組み合わせて、母音の有無に関わらずシングリッシュ単語をシンハラ語に変換することができる。まず、入力されたシングリッシュ単語をトークン化し、文字辞書と照合する。次に、ルールベースのマッピングプロセスを使用して、母音の有無に応じて適切なシンハラ語単語を特定する。最後に、ファジィロジックベースの実装を使用して、入力パターンと最も一致するシンハラ語単語を見つける。
この「Swa Bhasha」システムは、単語レベルで84%、提案レベルで92%の高い精度を達成している。これらの結果から、シングリッシュからシンハラ語への変換を行う際のユーザーエクスペリエンスを大幅に向上させることができると示唆されている。
Stats
シンハラ語には54の基本文字があり、18の母音文字と36の子音文字から構成される。
シンハラ語の変換には多くの制約があり、時間がかかる複雑なプロセスである。
多くのスリランカ人がシンプルな変換を行うためにシングリッシュを使用している。
本システムは単語レベルで84%、提案レベルで92%の高い精度を達成している。
Quotes
"シンハラ語への変換は非常に複雑で時間のかかる作業である。"
"多くのスリランカ人がシンプルな変換を行うためにシングリッシュを使用している。"
"本システムは単語レベルで84%、提案レベルで92%の高い精度を達成している。"