核心概念
UCLA音声学実験室アーカイブの95言語について、手動による音声分節化と音響分析を行い、言語横断的な音声研究のための基盤となるコーパスVoxAngelesを作成した。
要約
本研究では、UCLA音声学実験室アーカイブの95言語について、以下の作業を行った:
- 自動音声分析ツールを用いて、単語レベルの音声分節化を行った。
- 分節化結果を手動で確認・修正し、正確な分節化を行った。
- 各音声区間について、持続時間、母音のF0とフォルマント周波数などの音響分析を行った。
これにより、言語横断的な音声研究に活用できる、VoxAngelesコーパスを作成した。本コーパスには以下の特徴がある:
- 95言語、21言語族にわたる多言語音声データ
- 単語レベルの分節化と音響分析データ
- 言語横断的な音声研究、特に音声類型論の研究に活用可能
- 低資源言語の音声技術開発にも貢献できる
- 言語記述と保存、教育目的にも有用
本研究では、母音固有基本周波数の言語横断的分析を例として、VoxAngelesコーパスの有用性を示した。今後は、さらなるデータ拡充と分析を行い、言語音声学研究の発展に貢献していく。
統計
母音固有基本周波数の言語横断的分析では以下のような結果が得られた:
高母音/i/と低母音/a/の基本周波数差は、ほとんどの言語で期待通りの傾向(高母音の方が高い)を示した。
高母音/u/と低母音/a/の基本周波数差も、ほとんどの言語で期待通りの傾向を示した。
言語間でのばらつきはあるものの、全体としては母音高さと基本周波数の関係が確認された。
先行子音の無声化や後続音の休止などの要因が、母音固有基本周波数に影響を及ぼすことが示された。
引用
「言語記述と保存、教育目的にも有用」
「言語横断的な音声研究、特に音声類型論の研究に活用可能」
「低資源言語の音声技術開発にも貢献できる」