核心概念
本研究提出兩種基於元音的集成學習方法,用於從語音中識別抑鬱症,並探討其在輔助臨床診斷方面的可解釋性。
摘要
基於元音的集成學習方法:實現穩健且可解釋的語音抑鬱症識別
本研究旨在設計一種可解釋的機器學習演算法,利用語音資訊識別抑鬱症,並探討其在輔助臨床診斷和篩查方面的潛力。
本研究採用兩種集成學習方法:
自下而上方法: 訓練八個模型,分別預測患者健康問卷八項 (PHQ-8) 中每個項目的分數,然後將這些分數加總得到總的 PHQ-8 分數。
自上而下方法: 使用混合專家 (MoE) 模型,並結合路由模組來評估抑鬱症的嚴重程度。路由模組將樣本導向專門用於估計特定嚴重程度分數的專家模型。
兩種方法都使用預先訓練的基於元音的嵌入,並在 DAIC-WOZ 數據集上進行評估。