核心概念
노이즈로 인해 음수 값이 포함된 데이터에서도 비음수 제약을 유지하며 효과적으로 템플릿과 계수를 추출할 수 있는 Shift-NMF와 Nearly-NMF 알고리즘을 제안한다.
統計資料
노이즈가 있는 데이터에서 11.4%가 음수 값이다.
전체 데이터 중 61.1%가 결측값이다.
引述
"Even if all data values are positive, the noise values intrinsic in data collection mean that standard NMF as presented in (1) will perform suboptimally and will attempt to fit noise values when generating template and coefficient matrices."
"Any analysis of the data should treat both positive and negative values in a statistically consistent manner."