トランズファマ―及びCTCアプロ―チ以外でも新しいASRモダリング手法存在します。例えば、「Listen, Attend, and Spell (LAS)」モデルでは話者音声入力情報から文字列出力情報生成します。「Self-attentive sequential recommendation」等Attentionメカニズム採抱した深層学修系列推奨方式も注目すべき手法です。「Joint Grapheme and Phoneme Embeddings for Contextual End-to-End ASR」というグラフェイエム及ピョニエメバッジャング方式も採抱しています。
これ以外でも「Minimum word error training for non-autoregressive transformer-based code-switching ASR」等非自己回帰型Transformer基盤Code-Switched ASR模式等実装方策存在します。「Hybrid CTC/Attention Architecture for Agglutinative Language Speech Recognition」等接着形態语音识别模式採抱した混合型CTC/Attention结构也是值得关注的新兴领域之一です。今後さまざま技術進歩中,より効率的且つ精度高く次世代型ASL模式开发予想されます。
0
目次
セペディ-英語のコードスイッチング自動音声認識システムの評価
The evaluation of a code-switched Sepedi-English automatic speech recognition system