Core Concepts
量子アニーリングを用いて、均衡K-meansクラスタリングの高確率な解を効率的にサンプリングし、各解の事後確率を推定することで、曖昧なデータポイントを特定する。
Abstract
本研究では、量子アニーリング(AQC)を用いて、均衡K-meansクラスタリングの問題を解く手法を提案している。クラスタリングの目的関数を二次形式のエネルギー関数として定式化し、AQCを用いてボルツマン分布からサンプリングすることで、高確率な解を効率的に得ることができる。
従来の手法では最良の解のみを使用し、他の解は捨てていたが、本手法では全てのサンプルを利用して、各解の事後確率を推定する。これにより、曖昧なデータポイントを特定し、複数の解候補を提示することができる。
実験では、合成データおよび実データを用いて、本手法の有効性を確認している。量子アニーリングを用いた場合、シミュレーションや網羅的探索と同等の性能を示し、確率的な解を得ることができることを示している。また、事後確率の推定が適切に行われていることも確認している。
Stats
クラスタリングの目的関数は以下のように二次形式で表される:
E(X|Z) = Σ_k Σ_i∈Zk 1/2(xi - μk)^T(xi - μk)
ここで、Zはクラスタ割当を表す行列、μkはクラスタkの平均ベクトルである。
Quotes
"量子アルゴリズムは、従来のアルゴリズムに比べて大幅な高速化が期待できる一方で、本質的に確率的な性質を持つ。この性質を活かして、機械学習アルゴリズムの新しい家族を実現できる可能性がある。"
"従来のアプローチでは最良の解のみを使用し、他の解は捨てていたが、本手法では全てのサンプルを利用して、各解の事後確率を推定する。これにより、曖昧なデータポイントを特定し、複数の解候補を提示することができる。"