Kernkonzepte
データサンプリングとモンテカルロサンプリングからの分散を効果的に削減し、高速な最適化を実現する新しい「共同」制御変量が提案されています。
Zusammenfassung
ブラックボックス変分推論(BBVI)は、確率モデルの近似事後分布を見つけることを目指しており、KLダイバージェンスを最小化することで行われます。この記事では、データサンプリングとモンテカルロサンプリングからの分散が問題視され、新しい「共同」制御変量が提案されています。これにより、勾配の分散が大幅に削減され、いくつかのアプリケーションで高速な最適化が実現されます。BBVIはMCMC法の代替手段として人気があります。また、既存の制御変量はモンテカルロノイズに対処しますが、増分勾配法は通常データサブサンプリングに対処します。この記事では両方のソースからのノイズを低減する新しい「共同」制御変量が提案されています。
Statistiken
Task
Vn,ϵ[∇f(w; n, ϵ)]
Vn[∇f(w; n)]
Vϵ[∇f(w; ϵ)]
Sonar
4.04 × 10^4
2.02 × 10^4
1.16 × 10^4
Australian
9.16 × 10^4
8.61 × 10^4
2.07 × 10^3
MNIST
4.21 × 10^8
3.21 × 10^8
1.75 × 10^4
PPCA
1.69 × 10^10
1.68 × 10^10
3.73 × 10^7
Tennis
9.96 × 10^7
9.59 × 10^7
8.56 × 10^4
MovieLens
1.78 x 109
1.69 x 109
1.75 x106
Zitate
"Numerous methods exist to reduce the 'Monte Carlo' noise that comes from drawing samples from the variational distribution."
"This paper presents a method that jointly controls Monte Carlo and subsampling noise."
"The proposed joint estimator leads to faster convergence than existing approaches."