本論文では、ニューラルネットワークが高次元データから効率的に関連情報を抽出する方法について分析している。
まず、入力データの平均、共分散、高次の統計量(高次モーメント)が異なる2つのクラスを識別する混合累積モデル(MCM)を提案する。この問題では、高次の統計量を学習するのが計算的に困難であることが知られている。
しかし、潜在変数の間に相関がある場合、ニューラルネットワークは高次の統計量を効率的に学習できることを示す。具体的には、潜在変数の相関を導入すると、高次の統計量に対応する方向の学習が大幅に加速される。
この効果を単一ニューロンのパーセプトロンモデルで理論的に解析し、相関のある潜在変数では高次の統計量の学習が劇的に速くなることを示す。この結果は、ニューラルネットワークが高次元データから関連情報を抽出する際の新しいメカニズムを明らかにしている。
Egy másik nyelvre
a forrásanyagból
arxiv.org
Mélyebb kérdések