核心概念
通過利用自監督學習技術(特別是巴洛雙胞胎方法)來學習地震事件時間序列中的路徑不變性,可以顯著提高震源表徵任務(如跨目錄的震源辨別)的效能,並提供更可靠的預測不確定性估計。
摘要
書目資訊
Linville, L., Chai, C., Marthindale, N., Smith, J., Stewart, S., & Naugle, A. (2024). Toward path-invariant embeddings for local distance source characterization. EarthArXiv.
研究目標
本研究旨在探討自監督學習技術在學習地震事件時間序列中的路徑不變性方面的應用,以提高震源表徵任務的效能。
方法
研究人員採用了一種稱為巴洛雙胞胎 (Barlow Twins, BT) 的自監督學習方法,該方法源於對人類視覺皮層系統的理解,最初設想用於圖像領域。他們將 BT 方法應用於地震數據,通過將傳播路徑引入的失真視為噪聲並學習對其的不變性,來鼓勵神經網絡學習與震源相關的屬性。
主要發現
- 與監督學習方法相比,該方法將事件辨別任務的泛化能力提高了 10-12%。
- 該方法提供了更可靠的預測置信度。
- 數據集的規模和多樣性可能比模型架構更能決定當前效能的上限。
主要結論
通過學習路徑不變性,可以獲得更通用的地震震源表徵,從而提高震源表徵任務的效能。
意義
這項研究為開發用於震源屬性分配的地震基礎模型提供了一種新的途徑,並證明了自監督學習在處理地震數據方面的潛力。
局限性和未來研究方向
- 需要進一步研究數據集規模和多樣性對模型效能的影響。
- 未來的工作可以探索其他自監督學習技術和模型架構。
- 可以將該方法應用於其他震源表徵任務,如震級、深度和震源機制解的確定。
統計資料
與監督學習方法相比,該方法將事件辨別任務的泛化能力提高了 10-12%。
使用美國數據訓練的 BT 模型的平衡準確率從約 64% 提高到 70%,使用全球數據進一步訓練後提高到 72%。
當僅使用測試目錄中的兩個標籤進行訓練時,自監督表徵的效能優於監督遷移學習。
引述
"Our self-supervised approach adopts self-supervised ideas from the image domain but reframes the learning objective for station-level path invariance."
"This pilot study aims to assess how successfully generalizable seismic source representations can be obtained by learning path invariance with a self-supervised objective function called Barlow Twins (BT)."
"We suggest that scale in memory is not a valid proxy of informativeness when relying on datasets built from event catalogs produced by persistent monitoring operations, even though these are often the most prolific curated data sources in the seismic domain."