VoxHakkaは、台湾客家語の6つの主要方言を網羅し、高い自然性と正確性、低いリアルタイム係数を実現したテキスト・トゥ・スピーチシステムである。
言語モデルの文化的表現と包摂性を評価するための様々なプロキシと手法について調査し、その限界と課題を明らかにする。
セペディ-英語のコードスイッチング自動音声認識システムの評価において、CTCアプローチを使用したモデルが最適な性能を発揮するためには、適切なフィルター数の選択が重要である。
クルド方言の多様性に焦点を当て、中央クルド語のサブ方言に対する言語と音声技術のリソース開発を進める。