Core Concepts
欠損データを含むテーブルデータから、サンプル間の類似性を表す「フレンドネットワーク」を学習し、それを活用することで、より正確な欠損値の推定が可能になる。
Abstract
本論文は、欠損データ補完のための新しい手法「IGRM」を提案している。
従来のグラフニューラルネットワークベースの手法は、サンプル間の関係を考慮していなかった。
IGRMでは、サンプル間の類似性を表す「フレンドネットワーク」を導入し、それを活用することで、より正確な欠損値の推定が可能になる。
フレンドネットワークは、欠損値補完の学習過程と共に、反復的に最適化される。
8つのベンチマークデータセットで実験を行った結果、IGRMは既存手法と比べて平均絶対誤差が9.04%低いことが示された。
欠損率が高い場合でも、IGRMは良好な性能を維持できることが確認された。
提案手法の各要素の有効性を検証するための ablation studyも行われている。
Stats
欠損データが多い場合、サンプル間の類似性を直接計算すると大きな誤差が生じる。
提案手法のIGRMでは、サンプルの埋め込み表現を用いることで、この問題を緩和できる。
Quotes
"Similar sample should give more information about missing values."
"The large portion of missing data makes it hard to acquire accurate relations among samples."