מושגי ליבה
オーディオ拡張現実のために、ユーザーの実際の音響環境に適応した仮想音源をレンダリングするには、その環境の空間インパルス応答を推定する必要がある。本研究では、部屋固有の特徴と位置依存の特徴を考慮した、ブラインドな空間インパルス応答の生成手法を提案する。
תקציר
本研究では、オーディオ拡張現実のためのブラインドな空間インパルス応答の生成手法を提案している。
まず、エンコーダネットワークを用いて、部屋固有の特徴を抽出する。次に、その特徴と受信機-音源位置ベクトルを用いて、ディフュージョンモデルベースのジェネレータでSRIRを生成する。
この手法により、部屋固有の特徴と位置依存の特徴の両方を考慮した、知覚的に妥当なSRIRを生成できる。
評価では、残響時間、直接/残響エネルギー比、直接音到来方向などの指標で良好な結果が得られた。また、オンラインでの聴取例も提供している。
סטטיסטיקה
中域の残響時間の平均二乗誤差は0.206秒、相関係数は0.738である。
直接/残響エネルギー比の平均二乗誤差は2.62 dB、相関係数は0.872である。
直接音到来方向の平均誤差は3.46度である。
ציטוטים
"オーディオ拡張現実のために、ユーザーの実際の音響環境に適応した仮想音源をレンダリングするには、その環境の空間インパルス応答を推定する必要がある。"
"本研究では、部屋固有の特徴と位置依存の特徴を考慮した、ブラインドな空間インパルス応答の生成手法を提案する。"