核心概念
スコアベースの拡散モデルを事前分布として用いることで、残響環境下における自然音源からのHRTF推定を行う。
摘要
本研究では、スコアベースの拡散モデルを事前分布として用いることで、残響環境下における自然音源からのHRTF推定を行っている。具体的には以下の通りである:
- 残響環境下での測定データと自然音源信号を入力として、BRIRのパラメトリックモデルと共にHRTFを推定する。
- BRIRのパラメータと共にHRTFを最適化することで、一貫した尺度での推定を実現する。
- 拡散モデルを事前分布として用いることで、特に高周波数領域でのHRTF変動を良好にモデル化できることを示す。
- 提案手法は、訓練データから最も近いHRTFを選択するオラクルベースラインよりも優れた性能を示す。
统计
提案手法は、特に5-8 kHzの周波数帯域において、ジェネリックHRTFベースラインよりも8 dB以上低いLREを達成している。
8-17 kHzの高周波数帯域では、最近傍ベースラインよりも6 dB以上低いLREと2 dB以上低いLMDを示している。
引用
"拡散モデルを事前分布として用いることで、特に高周波数領域でのHRTF変動を良好にモデル化できる"
"提案手法は、訓練データから最も近いHRTFを選択するオラクルベースラインよりも優れた性能を示す"