温度や湿度変化による音速変動の影響を受けやすい従来のサウンドゾーン制御の問題に対し、本論文ではインパルス応答を補正するSICER法を提案し、音速変動に強いVASTベースのサウンドゾーン制御を実現する。
本研究では、仮想環境および実世界の音響処理アプリケーションのための効率的な学習ベースの音響伝搬手法を提案する。具体的には、学習ベースの室内インパルス応答生成器(FAST-RIR、MESH2IR、LISTEN2SCENE)、室内インパルス応答推定器(S2IR、AV-RIR)、および実世界の室内インパルス応答を用いた合成室内インパルス応答の品質向上手法(IR-GAN、TS-RIR)を提案する。
オーディオ拡張現実のために、ユーザーの実際の音響環境に適応した仮想音源をレンダリングするには、その環境の空間インパルス応答を推定する必要がある。本研究では、部屋固有の特徴と位置依存の特徴を考慮した、ブラインドな空間インパルス応答の生成手法を提案する。
多層拡散周波数動的畳み込みは、従来の周波数動的畳み込みに比べて、パラメータ数を大幅に削減しつつ、音響イベント検出の性能を向上させることができる。
SALT (Standardized Audio event Label Taxonomy) は、AudioSetのオントロジーの階層構造を基に、24の公開環境音データセットのラベルを統一的に標準化し、データセット間の互換性を高めるための分類法である。
部屋の反射特性プロトタイプを作成する際、受信位置の推定距離に基づいて重み付けを行うことで、最適な聴取位置での精度を高めつつ、聴取エリア全体での頑健性を維持する。
ラベル付きデータが限られる状況下で、自己教師学習と少量学習を組み合わせることで、特定の応用分野に特化した高精度な音響特徴抽出器を学習できる。
室内シーンの3次元幾何構造を推定するためには専用の深度センサが必要だが、それらは常に利用できるわけではない。本研究では、超音波エコーを用いた深度推定手法を提案し、その精度を向上させる。
本研究は、マルチチャンネルマイクロフォン信号から空間音響表現を自己教師なし学習する手法を提案する。提案手法は、チャンネル間の信号再構成を自己教師学習のプレテスクとして設計し、空間音響情報とスペクトル情報を分離して学習する。また、局所的および大域的な空間音響特性を捉えるために、多チャンネル Conformer を新たに提案する。実験結果から、提案手法は、シミュレーションデータおよび実世界データの両方において、空間音響パラメータの推定タスクで優れた性能を示すことが確認された。
ステアード応答パワー法は、中程度の残響と雑音の環境下で良好な位置推定性能を示すため、過去30年間にわたって広く使用されてきた。多くの研究がこの手法の計算コストの削減や、複数音源の検出と位置推定、悪環境下での性能向上を目的として行われてきた。