核心概念
うつ病患者の音声には特徴的な抑揚変化が見られるが、これは言語によっても異なる。本研究では、英語とマレーヤーラム語の両言語における音声データを用いて、うつ病検出のための言語非依存アプローチを提案する。
摘要
本研究の目的は、うつ病患者と健常者の音声特徴の違いを言語非依存で分析し、うつ病検出モデルを構築することである。
データ収集:
- 132人の英語とマレーヤーラム語の両言語を話せる参加者から、IViEコーパスの5種類の文章を読み上げた音声データを収集した。
- 参加者にはPHQ-9、PANAS、GAD、STAI-Tの4つの心理テストを実施し、うつ病の重症度を評価した。
データ拡張:
- ノイズ付加、時間スケール変更、時間シフト、ピッチシフトなどの手法を用いて、データ拡張を行った。
特徴抽出:
- ゼロクロス率、クロマ、MFCC、短時間エネルギー、メルスペクトログラムなどの特徴を抽出した。
モデル:
- 4層のCNNモデルを構築し、訓練、検証、テストを行った。
- 76%の高い精度で、うつ病の検出が可能であることが示された。
- 言語間でも安定した性能を示し、言語非依存性が確認された。
分析:
- 4種類のうつ病重症度に対する分類結果を分析したところ、各クラスの分類精度が高く、モデルの堅牢性が確認された。
- 言語間の強調語の分布分析では、明確な違いは見出せなかった。言語知覚の複雑性を示唆する結果となった。
统计
うつ病患者の音声は健常者に比べ、抑揚変化が大きい。
英語とマレーヤーラム語の両言語で、同様の音声特徴の違いが観察された。
CNNモデルによる分類精度は76%と高く、言語非依存性が確認された。
引用
"うつ病患者の音声には特徴的な抑揚変化が見られる"
"言語によってもこれらの抑揚変化は異なる"
"本研究では、英語とマレーヤーラム語の両言語における音声データを用いて、うつ病検出のための言語非依存アプローチを提案する"