核心概念
本稿では、情報幾何学に基づき、パラメータ化された確率測度の多様体上で動作する新しいフローマッチングフレームワークである、統計フローマッチング(SFM)を提案する。SFMは、カテゴリカル分布の多様体に適用され、フィッシャー情報計量を用いてリーマン構造を導入することで、最短経路である測地線を辿ることで効果的な生成モデリングを実現する。
本論文では、統計多様体上でのカテゴリカルフローマッチング(SFM)と呼ばれる、新しい生成モデリングのためのフレームワークを提案する。SFMは、情報幾何学、特にフィッシャー情報計量を用いて、パラメータ化された確率測度の多様体上にリーマン構造を導入する。この幾何学的アプローチにより、多様体上の測地線、すなわち最短経路に沿ってノイズ分布を目標データ分布に効果的にプッシュする時間依存ベクトル場を学習することができる。
離散データの生成モデリングにおいて、既存のフローベースの手法は、基礎となる統計多様体の真の幾何学的構造を捉えきれていない場合が多い。本研究では、統計多様体の固有の幾何学的特性を考慮することで、より正確かつ効率的な離散生成モデルを開発することを目的とする。