本研究では、COVID-19診断のための咳音分析タスクにおいて、黒箱モデルの決定に寄与する咳音の特徴領域を特定する手法を提案している。提案手法は、マスク生成ネットワークと学生ネットワークの2つの学習可能なネットワークから構成される。マスク生成ネットワークは、入力の重要な領域を特定し、学生ネットワークは黒箱モデルの局所的な振る舞いを近似する。これらのネットワークは、黒箱モデルへの入出力アクセスを利用して、共同最適化される。
提案手法は、画像分類タスクと音響イベント分類タスクでも評価され、既存手法と比較して優れた性能を示している。特に、COVID-19診断のための咳音分析タスクでは、提案手法が咳やのどかみなどの重要な音響特徴領域を的確に特定できることが示された。
翻譯成其他語言
從原文內容
arxiv.org
深入探究