核心概念
本稿では、周囲のノイズ除去と喘鳴検出を同時に行う、マルチチャンネル非負値行列因子分解(NMF)に基づく新しい手法を提案する。この手法は、従来の喘鳴検出法の課題であった、周囲ノイズの影響を受けやすい点と、医師の主観に依存する点を克服することを目指している。
要約
本稿では、聴診時のマルチチャンネル録音から背景ノイズ除去と喘鳴検出を同時に行う並列計算手法を提案している。
提案手法の概要
- デジタル聴診器で録音された2チャンネル信号から、喘鳴音の検出を行う。
- 信号の前処理、信号分解、喘鳴検出の3つの段階から構成される。
信号の前処理
- 短時間フーリエ変換(STFT)を用いて、入力信号を周波数領域で表現する。
- 特異値分解(SVD)を用いて、NMFの基底パラメータの初期値を効率的に設定する。これにより、計算の複雑さを軽減し、因子分解の精度を向上させる。
信号分解
- マルチチャンネル混合信号を、NMFに基づくアプローチを用いて反復的に分解する。
- 観測された信号スペクトログラムと推定された信号スペクトログラムとの間の以下のコスト関数を最小化する。
- C = DKL(X∥Xˆ) + DKL(Y∥Yˆ) + γo(BS)
- DKL(X∥Xˆ)は、一般化されたKulback–Leibler divergence。
- γo(BS)は、推定された基底BSができるだけ異なって(直交するように)することを保証する直交制約。
- このコスト関数を最小化するために、勾配降下アルゴリズムを適用する。
喘鳴音検出
- 信号分解段階で推定された生体信号のスペクトル基底BSから、喘鳴音と正常な呼吸音を区別する。
- 喘鳴音の周期的な性質を利用し、周波数領域におけるGini指数βを用いて、各基底の周期性の度合いを計算する。
- Gini指数βに基づいて閾値処理を行い、基底をクラスター化する。
- 喘鳴基底とその対応する活性化を用いて、推定喘鳴スペクトログラムXWを再構成する。
- XWのスペクトルエネルギー分布ξを計算し、Gini指数βを用いて、患者が健康かどうかを判断する。
評価実験
- 提案システムを、マルチチャンネル混合における喘鳴検出タスクについて評価した。
- さまざまな周囲ノイズと呼吸音源を組み合わせて、さまざまな信号対雑音比(SNR)でノイズの多い環境をシミュレートした。
- 評価指標として、感度、特異度、精度を用いた。
- 結果として、提案システムは、特にSNRが低い場合でも、喘鳴音を検出する高い能力を示した。
- また、提案システムは、比較手法と比較して、高い精度を達成した。
計算性能
- NVIDIA Jetson AGX Xavier開発キットを用いて、提案システムの計算性能を評価した。
- オーディオファイルの長さを60秒から900秒まで変化させて、提案システムの効率とスピードアップを評価した。
- 結果として、提案システムは、並列処理と高性能計算技術を駆使することで、リアルタイム処理を実現できることが示された。
結論
- 本稿で提案したシステムは、周囲のノイズ除去と喘鳴検出を同時に行う、リアルタイムで信頼性の高い喘鳴検出システムである。
- 提案システムは、従来の喘鳴検出法の課題であった、周囲ノイズの影響を受けやすい点と、医師の主観に依存する点を克服するものである。
統計
提案システムは、SNRが0dB以上の環境では、常に高い精度(約90%以上)で喘鳴音を検出することができた。
提案システムは、NVIDIA Jetson AGX Xavier開発キットを用いることで、15分の音声データに対して約3分で処理を行うことができた。
引用
"Removing ambient noises from auscultation recordings to maximize the reliability of diagnoses has been a hot topic in the biomedical signal processing field during the last decade."
"In this work, a parallel computing system is proposed to address jointly the background denoising and the wheezing detection from a multi-channel recording captured during the auscultation process."
"The proposed system has been evaluated for the task of wheezing detection showing a significant improvement over state-of-the-art algorithms when noisy sound sources are present."