核心概念
ソラーニー・クルド語の方言を正確に識別するためのデータセットの構築と深層学習モデルの開発
要約
本研究では、ソラーニー・クルド語の6つの方言(ガルミアーニ、ヘウレリー、カルクーキー、ピシュダリー、スレイマーニー、ホシュナウィー)を識別するためのデータセットを構築しました。
107人の話者から29時間16分40秒の音声データを収集し、Sorani Nasデータセットを作成しました。
話者の性別、年齢、教育レベルなどの情報を含んでいます。
データセットの不均衡を解消するため、オーバーサンプリングとアンダーサンプリングの手法を適用しました。
ANN、CNN、RNN-LSTMの3つの深層学習モデルを開発し、様々な設定で実験を行いました。
RNN-LSTMモデルが最も高い96%の精度を達成しました。CNNは93%、ANNは75%でした。
特に、オーバーサンプリングを行った均衡化データセットを使用した場合に精度が向上しました。
今後の研究では、他のクルド語方言の識別にも取り組む予定です。
統計
収集した音声データの総時間は29時間16分40秒です。
方言別の内訳は、ピシュダリー6時間49分16秒、ヘウレリー5時間13分、カルクーキー5時間45分、ホシュナウィー4時間50分22秒、スレイマーニー4時間29分27秒、ガルミアーニ2時間58分34秒です。
引用
"ソラーニー・クルド語の方言識別は、公開されたデータセットや信頼できるリソースの欠如により課題となっています。"
"RNN-LSTMモデルは他の手法よりも優れた96%の精度を達成しました。"
"特にオーバーサンプリングを行った均衡化データセットを使用した場合に精度が向上しました。"