핵심 개념
ラベル付けされた心臓聴診信号データの不足を克服するために、従来の音声処理手法と拡散モデル(WaveGradとDiffWave)を用いた条件付き合成音声生成を組み合わせたデータ拡張手法が提案されており、これにより、異常心音分類器のロバスト性(in-distributionおよびout-of-distribution性能)が向上することが示されています。
Abbotta, L., Marocchi, M., Fynn, M., Rong, Y., & Nordholm, S. (2024). Generative Deep Learning and Signal Processing for Data Augmentation of Cardiac Auscultation Signals: Improving Model Robustness Using Synthetic Audio. arXiv preprint arXiv:2410.10125.
本研究は、心臓聴診信号のデータセットが限られている問題に対処するため、従来の音声処理技術と生成ディープラーニングを用いた新しいデータ拡張手法を提案し、異常心音分類モデルのロバスト性を向上させることを目的としています。