本研究では、自然画像の生成に成功した深層生成モデルの手法を、多変量時系列データの生成に応用することを提案する。多変量時系列データの生成は、神経学者、精神科医、環境学者、経済学者などの専門家にとって有用なツールとなる可能性がある。しかし、サンプルサイズが小さいという課題がある。
提案手法では、データ分布の双対形式での発散を推定することで、データ分布を効率的かつ解釈可能に特徴付ける。具体的には以下の手順を踏む:
データ分布と周辺分布の双対発散を推定し、データ分布を双対空間に埋め込む。これにより、データ分布の大域的な依存構造を捉える。
近傍データ点間の局所的な発散も推定し、データ分布の細かな特徴を捉える。これにより、データ分布を多重スケールでクラスタリングする。
最適化された双対空間上で、クラスタ間の空隙を埋めるように新規サンプルを生成する。
生成サンプルとデータ分布の発散も最小化することで、生成サンプルの品質を担保する。
提案手法は、理論的保証を持ち、多様なデータセットでの実験結果が既存手法を上回ることを示している。
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Sahil Garg,A... at arxiv.org 04-12-2024
https://arxiv.org/pdf/2404.07377.pdfDeeper Inquiries