本論文では、McKean-Vlasov型確率微分方程式(MV-SDE)を機械学習タスクに適用するための新しいニューラルネットワークアーキテクチャを提案している。MV-SDEは、粒子間の相互作用を通じて分布依存性を持つ拡散過程をモデル化する。
提案するアーキテクチャには以下の3つがある:
これらのアーキテクチャは、従来のItô型SDEに比べて、より柔軟な確率流を表現できる。理論的には、IMアーキテクチャには暗黙的な正則化効果があり、MLアーキテクチャは遷移密度のPDE表現を利用できる。
実験では、時系列モデリングと生成モデリングのタスクで提案手法の有効性を示している。MV-SDEベースのアーキテクチャは、Itô-SDEベースのモデルよりも優れた性能を示した。特に、分布依存性を明示的に考慮することで、ジャンプ挙動などの複雑な動的特性をうまくモデル化できることが分かった。
Til et andet sprog
fra kildeindhold
arxiv.org
Vigtigste indsigter udtrukket fra
by Haoming Yang... kl. arxiv.org 04-16-2024
https://arxiv.org/pdf/2404.09402.pdfDybere Forespørgsler