Core Concepts
一般目的オーディオ表現を使用することで、心音検出タスクにおいて従来手法を上回るパフォーマンスを達成できることを示した。
Abstract
本研究では、心音検出タスクにおける一般目的オーディオ表現の有効性を検証した。心音検出は医療診断の重要な手段であるが、熟練した医師の判断を必要とするため、自動化の取り組みが行われている。しかし、心音データセットの規模が小さいため、深層学習モデルの適用が困難であった。
そこで本研究では、大規模データセットで事前学習された一般目的オーディオ表現モデルに着目した。具体的には、CNN14、BYOL-A、AST、M2Dの4つのモデルを評価した。実験の結果、最新のM2Dモデルが従来手法を上回る性能を示した。他のモデルも一部のクラス検出で優れた性能を示しており、モデルの組み合わせによりさらなる性能向上が可能であることが確認された。
これらの結果は、一般目的オーディオ表現が心音処理に有効であることを示しており、今後の医療診断支援への応用が期待される。また、事前学習モデルの組み合わせによる性能向上の可能性も示唆された。
Stats
心音検出タスクにおいて、M2Dモデルは重み付き正解率0.832、加重平均再現率0.713を達成した。
他のモデルと組み合わせることで、重み付き正解率0.832、加重平均再現率0.733まで性能が向上した。
Quotes
"一般目的オーディオ表現を使用することで、心音検出タスクにおいて従来手法を上回るパフォーマンスを達成できることを示した。"
"事前学習モデルの組み合わせによる性能向上の可能性も示唆された。"