핵심 개념
本文提出了一種利用最小對比估計器,針對非均勻泊松過程和標記泊松過程,進行多個離線變更點檢測的有效方法,並透過模擬和實際數據集驗證了該方法的有效性。
標題: 針對某些點過程的多個變更點檢測的有效方法
作者: Charlotte Dion-Blanc, Diala Hawat, Emilie Lebarbier, Stéphane Robin
期刊: 預印本 (arXiv:2302.09103v3 [stat.ME] 6 Nov 2024)
研究目標: 本文旨在針對非均勻泊松過程和標記泊松過程,開發一種有效的方法來檢測多個離線變更點。
方法:
本文提出了一種基於最小對比估計器的變更點檢測方法。
針對泊松過程的特性,採用交叉驗證程序來選擇適當的變更點數量。
透過時間尺度轉換定理,將該方法擴展到具有強度變化的自激勵過程(Hawkes 類過程)。
主要發現:
本文證明,在合理的對比函數假設下,可以在已知的有限網格內找到最佳分割,從而可以透過動態規劃進行恢復。
交叉驗證程序有效地利用了泊松過程的稀疏性,確保了選擇的變更點數量的有效性。
透過模擬和實際數據集的實驗,證明了該方法在檢測變更點方面的準確性和效率。
主要結論: 本文提出的方法為非均勻泊松過程和標記泊松過程的多個變更點檢測提供了一種有效且通用的解決方案。該方法已在 R 套件 CptPointProcess 中實現。
意義: 變更點檢測在各個領域都有廣泛的應用,例如火山學、流行病學和網絡攻擊建模。本文提出的方法為這些領域提供了強大的工具,可以提高對時間序列數據中行為變化的理解。
限制和未來研究:
未來的工作可以探討將該方法擴展到其他類型的點過程,例如具有更一般強度函數的 Hawkes 過程。
此外,可以進一步研究該方法在線上變更點檢測環境中的性能。
통계
本文使用了多個模擬數據集,其中事件的數量從 32 到 1000 不等。
對於標記泊松過程,標記分佈的參數設定為 0.1 或在奇數和偶數段之間交替出現 0.1 和 0.005。
對於分段 Hawkes 類型過程,比率 R = c+/c− 設定為 2、3 和 6。
學習週期 Tlearn 的長度設定為 1 或 10。
交叉驗證程序使用了 500 個樣本,採樣概率設定為 4/5。