核心概念
本稿では、従来の最小絶対偏差(LAD)回帰が裾の重いデータの影響を受けやすいという問題に対し、新しいCatoni型打ち切り最小化問題フレームワークを提案し、高次元時系列データにおけるロバストなLAD回帰を実現する。
要約
論文概要
本稿は、裾の重い高次元時系列データにおける最小絶対偏差(LAD)回帰問題を考察した研究論文である。具体的には、1 < α ≤ 2 の範囲で有限のα次モーメントを持つデータに対して、Catoni型打ち切り最小化問題フレームワークを提案し、その有効性を示している。
研究背景
LAD回帰は、外れ値に対してロバストな回帰手法として知られている。しかし、従来のLAD回帰は、データが裾の重い分布に従う場合、その性能が低下することが知られていた。特に、高次元時系列データにおいては、その影響が顕著となる。
研究内容
本稿では、この問題に対処するため、Catoni型打ち切り関数を用いた新しいLAD回帰手法を提案している。具体的には、損失関数を打ち切り関数によって修正することで、外れ値の影響を抑制している。さらに、高次元データに対応するため、L1正則化項を導入している。
結果
提案手法の性能を評価するため、シミュレーション実験と実データ分析を行っている。その結果、提案手法は、従来のLAD回帰と比較して、裾の重いデータに対してよりロバストであることが示された。
結論
本稿では、裾の重い高次元時系列データに対して、ロバストなLAD回帰を実現する新しい手法を提案した。提案手法は、従来手法と比較して、外れ値の影響を受けにくく、より正確な推定結果を得ることができる。
統計
従来のLAD推定のリスクは発散する傾向がある。
シミュレーションでは、VAR(1)モデルとVAR(2)モデルを使用。
パレート分布とフレシェ分布は、形状パラメータµとνが(1, 2]の範囲で裾の重い分布を示す。
Hill推定を用いて、データが4次モーメントを持つ裾の重い分布に従うことを確認。
引用
"Since the LAD has a strong robustness, it is natural to ask whether one can extend this result to the LAD with finite 2-nd moment and obtain an excess risk in the order O(√d/n)"
"In this paper, we shall use a simple 1-dimensional toy model to show that it is impossible to extend the robust least square regression in [3] to the LAD with finite 2-nd moment and obtain an excess risk in the order √d/n. So a truncation is essential to mitigate the bad effect of outliers"
"From our simulations for the LAD in the VAR(p), we observe that the larger the p is or the smaller the α is, the worse the performance of LAD will be."