Concepts de base
本文提出了一種新的基於Bahadur-Rao類型的級數展開方法,用於在有限樣本情況下逼近排名與選擇(R&S)問題中的正確選擇概率(PCS),並基於此開發了一種新的有限預算分配策略,以提高序數優化的有限樣本性能。
Résumé
文獻回顧
- 排名與選擇(R&S)問題旨在通過蒙特卡洛模擬,從有限的設計方案集合中找出最佳方案。
- 現有許多有效的預算分配算法,例如OCBA和ROA,它們在模擬樣本數量充足的情況下表現良好。
- 然而,在有限樣本情況下,PCS的行為可能與其漸近行為有很大差異,現有方法存在以下問題:
- 無法準確捕捉有限樣本量對PCS的影響。
- 無法準確逼近PCS,不足以指導有限樣本情況下高效分配算法的開發。
- 在低置信度場景下,PCS可能不會隨著模擬樣本的累積而單調遞增,現有方法缺乏對此現象的定量分析。
本文貢獻
- 本文提出了一種新的基於Bahadur-Rao類型的級數展開方法,用於逼近PCS,該方法相較於傳統的大偏差理論,能夠更好地捕捉PCS在有限樣本情況下的行為。
- 基於該方法,本文提出了一種新的有限預算分配策略(FCBA),通過迭代估計最優性條件並相應地平衡採樣率,以提高序數優化的有限樣本性能。
- 本文通過數值實驗證明,與現有方法相比,FCBA策略在有限樣本情況下能獲得更好的PCS性能。
- 本文還探討了低置信度場景下PCS的非單調性問題,並提出了一種改進的展開方法和相應的分配策略來解決該問題。
方法概述
- 本文提出的Bahadur-Rao類型展開方法基於以下兩個假設:
- 採樣分佈具有有限的累積量生成函數(CGF)。
- 採樣分佈具有有限的全變差(BTV)。
- 該方法的主要步驟如下:
- 利用指數傾斜技術,將PCS中佔主導地位的指數項提取出來。
- 利用Edgeworth展開,將剩餘項表示為採樣分佈概率密度函數的級數展開。
- 將上述兩個展開式結合起來,得到PCS的Bahadur-Rao類型展開式。
結果分析
- 本文推導了高斯採樣分佈下PCS的Bahadur-Rao類型展開式的具體形式。
- 分析表明,該展開式是漸近凹的,這為利用Karush-Kuhn-Tucker條件逼近最優採樣率提供了理論依據。
- 本文還將該方法推廣到低置信度場景和條件概率的逼近,並討論了其應用前景。
總結
本文提出了一種新的逼近PCS的方法,並基於此開發了一種新的有限預算分配策略,為提高序數優化的有限樣本性能提供了新的思路。