本研究の主な内容は以下の通りである:
従来のILRMAでは、非負行列因子分解(NMF)とノンネガティブ正準多項式分解(NCPD)を用いてソースパラメータをモデル化していたが、チャンネル間の依存性を十分に捉えられないという課題があった。一方、NCPDはより高次の構造を捉えられるが、潜在因子の解釈が難しく、事前情報を制約として組み込むのが困難であった。
そこで本研究では、非負値ブロック項分解(NBTD)に基づく新しい集群化ソースモデルを提案した。このモデルでは、ソースパラメータをベクトルとマトリクスの外積の和で表現することで、潜在ベクトルの解釈が容易になり、直交制約を課すことで音源間の独立性を確保できる。
提案手法であるcILRMAは、無響環境下では従来手法を上回る性能を示し、有響環境下でもILRMAよりも優れた結果が得られた。また、パラメータの収束特性や、ブロック数Oおよび基底数の影響についても検討を行った。
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Jianyu Wang,... at arxiv.org 05-07-2024
https://arxiv.org/pdf/2405.03118.pdfDeeper Inquiries