核心概念
ノイズに汚染された観測データから、共通の低ランク特徴、個別の低ランク特徴、スパースなノイズ成分を正確に分離する。
要約
本論文では、N個の観測行列から共通の低ランク特徴、個別の低ランク特徴、スパースなノイズ成分を分離する問題を扱う。
- 観測行列は共通の低ランク成分、個別の低ランク成分、スパースなノイズ成分の重ね合わせで表現される。
- 共通特徴と個別特徴は直交するという制約を設ける。これは特徴の独立性を表す。
- ノイズはスパースであると仮定する。つまり、各行列の各行と各列でノイズが非ゼロとなるエントリは少数に限定される。
- 共通特徴、個別特徴、ノイズの分離が可能となる十分条件を示す。これらの条件は特徴の非集中性と個別特徴の非整列性を要求する。
- 提案するTCMFアルゴリズムは、交互最小化法に基づき、ハードしきい値処理と共通・個別特徴の推定を繰り返す。
- TCMFは理論的な収束保証を持ち、ビデオ分割や異常検知などの応用例で優れた性能を示す。
統計
観測行列M(i)は、共通の低ランク成分U⋆gV⋆T(i),g、個別の低ランク成分U⋆(i),lV⋆T(i),l、スパースなノイズS⋆(i)の重ね合わせで表現される。
共通特徴U⋆gと個別特徴U⋆(i),lは直交する。
各ノイズ成分S⋆(i)はα-スパースである。つまり、各行と各列でノイズが非ゼロとなるエントリは全体の一定割合以下に限定される。
引用
"When we have N observation matrices from N different and associated sources corrupted by sparse and potentially gross noise, can we recover the common and unique components from these noisy observations?"
"Despite the difficulty, we propose an intuitive alternating minimization algorithm called triple component matrix factorization (TCMF) to recover the three components exactly."
"TCMF is distinguished from existing works in literature thanks to two salient features. First, TCMF is a principled method to separate the three components given noisy observations provably. Second, the bulk of the computation in TCMF can be distributed."