Core Concepts
バイアスのある入力データから、効率的に目標分布を正確に要約する新しい圧縮手法を提案した。等重み圧縮では√n個の点で e
O(n−1/2)の最大平均誤差を達成し、重み付き圧縮では poly-log(n)個の点で同等の精度を実現できる。
Abstract
本研究では、バイアスのある入力データから目標分布を正確に要約する新しい圧縮手法を提案した。
主な貢献は以下の通り:
等重み圧縮のためのSten Kernel Thinning (SKT)アルゴリズムを提案した。これは、バイアス補正と無バイアス圧縮を組み合わせ、√n個の点で e
O(n−1/2)の最大平均誤差を達成する。
大規模な圧縮問題に対応するため、Low-rank SKTを提案した。これは、Compress++の効率的な要約手法とAdaptive Low-rank Debiasing手順を組み合わせ、同等の精度を亜二次時間で実現する。
単純ベクトル重み付き圧縮のためのSten Recombinationを提案した。これは、poly-log(n)個の点で SKTと同等の精度を達成する。
定数保存重み付き圧縮のためのSten Choleskyを提案した。これも poly-log(n)個の点で SKTと同等の精度を達成する。
これらの手法は、カーネル行列の固有値減衰率や Stein カーネル Hilbert空間の被覆数に関する新しい保証に基づいている。実験では、バーンイン、近似MCMC、テンパリングなどのバイアスを持つ入力データに対して、コンパクトで正確な要約を提供することを示した。
Stats
入力データ数nが大きくなるにつれ、提案手法の最大平均誤差がn−1/2のオーダーで減少する
提案手法は、等重み圧縮では√n個の点、重み付き圧縮では poly-log(n)個の点で、目標分布への最大平均誤差をn−1/2のオーダーに抑えられる
Quotes
"バイアスのある入力データから、効率的に目標分布を正確に要約する新しい圧縮手法を提案した。"
"等重み圧縮では√n個の点で e
O(n−1/2)の最大平均誤差を達成し、重み付き圧縮では poly-log(n)個の点で同等の精度を実現できる。"