toplogo
登入

基於邊緣運算的多模式隱私保護咳嗽偵測演算法:Cough-E


核心概念
本文提出了一種名為 Cough-E 的新型咳嗽偵測演算法,該演算法利用音訊和運動感測器數據,並針對邊緣裝置進行了優化,以實現實時、隱私保護和節能的咳嗽監測。
摘要
edit_icon

客製化摘要

edit_icon

使用 AI 重寫

edit_icon

產生引用格式

translate_icon

翻譯原文

visual_icon

產生心智圖

visit_icon

前往原文

導言 持續性咳嗽監測對於醫生進行居家監測和治療呼吸系統疾病非常有幫助。 現有的咳嗽偵測演算法在數據隱私和長期監測方面存在限制。 邊緣人工智慧 (Edge-AI) 是一種很有前景的解決方案,它可以在數據源頭附近處理隱私敏感數據。 然而,在資源受限的設備上部署高效能但資源需求大的演算法也帶來了挑戰。 方法 邊緣人工智慧超參數權衡分析 **信號選擇:**比較了胸部麥克風、外置麥克風和運動感測器的性能。 **信號採樣率:**評估了不同採樣率(16、8 和 4 kHz)對音訊分類性能的影響。 **窗口長度:**評估了不同窗口長度(0.4 到 1.0 秒)對分類器的影響。 **特徵提取和優化:**使用了時域、頻域和梅爾頻率域特徵,並通過遞迴特徵消除和交叉驗證 (RFECV) 進行了優化。 分類器訓練和優化 使用音訊和運動數據訓練了輕量級、可解釋的機器學習分類器(XGBoost)。 採用嵌套交叉驗證框架來驗證超參數選擇和模型性能。 邊緣人工智慧模型執行 模擬了邊緣人工智慧執行流程,以評估多模式參數對執行時間和能耗的影響。 考慮了三種執行配置:僅運動模型、僅音訊模型和多模式模型。 多模式模型設計和執行 提出了一種多模式分類方法,利用運動分類器作為音訊分類器的觸發機制。 探索了不同的多模式執行模式(無重新運行和重新運行)及其對性能和能耗的影響。 後處理演算法 設計了一種基於音訊的後處理演算法,用於提取每個咳嗽事件的確切開始和結束位置。 該演算法利用了咳嗽生理學和特定於受試者的信息來完善咳嗽區域。 機器學習性能指標 使用基於事件的成功指標(靈敏度、精確度、F1 分數和每小時誤報數)來評估模型性能。 結果 邊緣人工智慧超參數共同優化 **感測器選擇:**外置麥克風表現出最高的咳嗽事件檢測性能。 **音訊模型優化:**8 kHz 採樣率和 0.8 秒窗口長度提供了最佳性能。 **梅爾頻譜圖與 MFCC 特徵:**梅爾頻譜圖特徵在所有窗口長度上都具有更高的平均性能,並且在嵌入式平台上效率更高。 **特徵數量選擇:**RFECV 選擇了 84 個特徵,在保持高平均精度得分的同时,降低了佔空比。 **運動模型優化:**使用 36 個特徵的分類器表現出最高的性能。 多模式模型性能 與僅使用音訊的模型相比,多模式方法在 F1 分數僅下降 1.26% 的情況下,實現了 70.56% 的能耗降低。 結論 本文提出了一種基於邊緣運算的多模式咳嗽偵測演算法 Cough-E,該演算法利用音訊和運動數據,並針對邊緣裝置進行了優化。 Cough-E 在保持高精度咳嗽檢測的同時,顯著降低了能耗,使其適用於實時、隱私保護和節能的咳嗽監測。
統計資料
與僅使用音訊的模型相比,Cough-E 在 F1 分數僅下降 1.26% 的情況下,實現了 70.56% 的能耗降低。 外置麥克風的 F1 分數表現最佳,相較之下,胸部麥克風和運動模型的平均 F1 分數分別降低了 9.3% 和 16.5%。 8 kHz 採樣率的音訊模型的 F1 分數比原始 16 kHz 模型提高了 1.67%。 使用梅爾頻譜圖特徵的模型在所有窗口長度上都比使用 MFCC 特徵的模型具有更高的平均性能。 與使用餘弦查找表的 MFCC 相比,採用梅爾頻譜圖可將能耗降低 20 倍。 RFECV 選擇了 84 個特徵,在保持高平均精度得分的同时,將佔空比降低到 23.62%。

深入探究

除了咳嗽檢測之外,本文提出的多模式邊緣人工智慧方法還能應用於哪些其他醫療保健應用?

本文提出的多模式邊緣人工智慧方法,其核心是利用低功耗、可解釋的機器學習模型,結合多種生理訊號,實現實時、保護隱私的健康監測。除了咳嗽檢測,這種方法還可以用於許多其他的醫療保健應用,例如: 睡眠階段監測: 結合使用加速度計、心率感測器和麥克風,可以識別不同的睡眠階段(例如清醒、淺睡、深睡和快速眼動睡眠)。邊緣AI可以實時分析這些數據,提供個人化的睡眠分析和建議。 跌倒檢測: 利用加速度計和陀螺儀數據,可以訓練模型識別跌倒事件。邊緣AI可以實時檢測跌倒,並自動發送警報給緊急聯絡人或醫療機構。 心律失常檢測: 通過分析心電圖 (ECG) 或光體積變化描記圖法 (PPG) 訊號,可以訓練模型識別心律失常,例如心房顫動。邊緣AI可以持續監測心律,並在檢測到異常時提醒使用者。 壓力和情緒監測: 結合心率變異性 (HRV)、皮膚電反應 (GSR) 和體溫等生理訊號,可以推斷使用者的壓力水平和情緒狀態。邊緣AI可以提供實時的壓力監測和放鬆指導。 總之,任何需要實時分析多種生理訊號,並對隱私和功耗有要求的醫療保健應用,都可以從本文提出的方法中受益。

如果收集到的數據存在偏差,例如某些人群的咳嗽聲音與其他人群不同,那麼該演算法的準確性和可靠性如何?

如果訓練數據存在偏差,例如某些人群的咳嗽聲音與其他人群不同,那麼該演算法的準確性和可靠性就會受到影響。具體來說: 準確性下降: 由於模型在訓練過程中沒有接觸到代表性不足人群的數據,因此在面對這些人群的咳嗽聲音時,模型的識別準確率會下降。 可靠性降低: 模型在不同人群上的表現差異會導致其可靠性降低,使用者難以信任模型的判斷結果。 為了提高演算法在數據偏差情況下的準確性和可靠性,可以採取以下措施: 收集更多樣化的數據: 在訓練模型時,應盡可能收集來自不同人群、不同年齡、不同性別和不同健康狀況的數據,以確保模型的泛化能力。 數據增強: 對於代表性不足的群體,可以使用數據增強技術,例如音頻變調、添加噪聲等,來擴充訓練數據集。 遷移學習: 可以使用遷移學習技術,將在大型、多樣化的數據集上預先訓練好的模型遷移到特定人群的數據集上進行微調,以提高模型的適應性。 模型校準: 可以使用模型校準技術,根據不同人群的數據特點對模型的輸出進行調整,以提高模型的準確性。 總之,數據偏差是影響演算法準確性和可靠性的重要因素。通過採取適當的措施,可以減輕數據偏差帶來的負面影響,提高演算法的泛化能力和可靠性。

未來,如何將 Cough-E 與其他生理感測器(如心率或血氧飽和度監測器)整合,以提供更全面的呼吸健康評估?

將 Cough-E 與其他生理感測器整合,可以提供更全面、更準確的呼吸健康評估。以下是一些整合方案: 1. 數據融合: 特徵級融合: 將 Cough-E 提取的咳嗽特徵與心率、血氧飽和度等生理指標融合,訓練更強大的機器學習模型,以識別更複雜的呼吸狀況,例如哮喘、肺炎等。 決策級融合: 分別使用 Cough-E 和其他生理感測器模型進行預測,然後根據預測結果的置信度或投票機制,做出最終的呼吸健康評估。 2. 多模態模型: 開發能夠同時處理咳嗽聲音、心率、血氧飽和度等多種生理訊號的深度學習模型,例如多模態遞迴神經網路 (RNN) 或圖神經網路 (GNN),以捕捉不同生理訊號之間的複雜關係,提高呼吸健康評估的準確性。 3. 應用場景: 遠程患者監測: 將整合後的系統應用於遠程患者監測,可以實時監測患者的咳嗽頻率、心率、血氧飽和度等指標,及早發現病情變化,並及時採取干預措施。 睡眠呼吸暫停診斷: 結合咳嗽檢測、心率和血氧監測,可以更準確地診斷睡眠呼吸暫停綜合症,並評估治療效果。 慢性阻塞性肺病 (COPD) 管理: 通過監測咳嗽、心率、血氧等指標,可以幫助 COPD 患者更好地管理病情,預防急性加重的發生。 挑戰: 數據同步: 需要解決不同感測器數據採樣率和時間同步的問題。 模型複雜度: 整合多個感測器數據會增加模型的複雜度,需要更強大的計算能力和更優化的算法。 臨床驗證: 需要進行大規模的臨床試驗,驗證整合系統的有效性和可靠性。 總之,將 Cough-E 與其他生理感測器整合具有巨大的潛力,可以為呼吸健康評估提供更全面、更準確的信息,推動呼吸系統疾病的診斷、治療和管理邁向新的台階。
0
star