核心概念
針對高度設限的可靠性資料,本文提出了兩種新型子抽樣策略(RDS 和 RDCS),並推導了其理論性質和最佳子抽樣概率,相較於傳統方法,顯著提升了參數估計的效率和準確性。
論文資訊
Ruan, Y., Li, Z., Li, Z., Lin, D. K. J., Hu, Q., & Yu, D. (2024). Novel Subsampling Strategies for Heavily Censored Reliability Data. Statistics and Its Interface, 0, 1–12.
研究目標
針對大量且高度設限的可靠性資料,開發高效的子抽樣方法,以估計產品壽命分佈的參數。
方法
提出了兩種子抽樣策略:適用於中等設限率的 RDS(可靠性資料通用子抽樣方法)和適用於極高設限率的 RDCS(可靠性資料設限子抽樣方法)。
基於 L 最優性準則推導了最佳子抽樣概率,該準則旨在最小化漸近協方差矩陣和常數矩陣乘積的跡。
提出了兩種實用算法來實現所提出的子抽樣方法,解決了最佳子抽樣策略依賴於完整資料的未知參數估計的挑戰。
主要發現
推導了 RDS 和 RDCS 子抽樣估計量的漸近正態性,證明了其統計有效性和估計準確性。
通過模擬研究和實際應用(Backblaze 硬盤資料集)驗證了所提出的方法相較於均勻子抽樣方法的優越性。
主要結論
RDS 和 RDCS 為分析大量設限壽命資料提供了有效的工具,顯著減少了計算負擔,同時保持了估計的準確性。
所提出的方法在可靠性工程領域具有廣泛的應用前景,特別是在處理高度可靠產品的資料時。
研究意義
本研究填補了現有子抽樣方法在分析高度設限可靠性資料方面的空白。
所提出的方法為可靠性分析提供了更有效且實用的工具,有助於更準確地評估產品壽命和可靠性。
局限性和未來研究方向
未來的研究可以探討其他最優性準則,例如 A 最優性準則,以進一步優化子抽樣策略。
可以進一步研究如何將所提出的方法推廣到其他類型的設限資料,例如區間設限資料。
統計資料
Backblaze 公司自 2013 年開始收集硬盤的每日統計數據,這些數據將持續收集直到硬盤發生故障。
研究使用了 2016 年至 2018 年的 Backblaze 硬盤數據,並提取了 ST4000DM000 型號的數據進行分析。
在分析中,所有時間值都通過除以 10 的 6 次方進行標準化,以使參數值保持在實際範圍內。
參數 ξ 和 ξc 設定為 0.1,以確保算法的穩定性和有效性。
实验重复进行了 500 次,以评估方法的鲁棒性和一致性。