المفاهيم الأساسية
本文提出了一種基於非預期速率失真函數(NRDF)的新方法,用於近似計算離散馬可夫源在有限時域內,受限於每階段平均單字母失真標準的零延遲可變速率損失源編碼系統的經驗速率下界。
本論文研究了一種基於非預期速率失真函數(NRDF)的非漸進下界的計算方法,該方法適用於離散馬可夫源在離散時間零延遲可變速率損失壓縮問題上的應用,並採用每階段單字母失真作為衡量標準。首先,我們針對馬可夫源和單字母失真推導出 NRDF 的一種新的信息結構。其次,我們推導出 NRDF 的新的凸性結果,這有助於利用拉格朗日對偶定理將問題轉化為一個無約束的部分可觀測有限時域隨機動態規劃(DP)算法,該算法受限於一個概率狀態(置信狀態),該狀態總結了过去關於再生符號的信息,並在一個連續狀態空間中取值。我們沒有直接逼近 DP 算法,而是使用 Karush-Kuhn-Tucker (KKT) 條件來找到隨機 DP 最優控制策略(即 NRDF 的最小化分佈)的隱式閉式表達式,並通過一種新的動態交替最小化(AM)方法分階段逼近控制策略和代價函數(速率的函數),該方法通過使用反向遞歸運行的離線算法實現,並具有可證明的收斂性保證。我們使用一個在任何有限時域內運行的在線(前向)算法獲得上述量的精確值。我們的方法為精確的 NRDF 解提供了一個近似解,當置信狀態的搜索空間在每個時間階段變得足夠大時,該解將接近最優解。我們通過模擬研究驗證了我們的理論發現,在模擬研究中,我們應用我們的算法,假設時變和時不變的二元馬可夫過程。
主要貢獻
針對離散馬可夫源和單字母失真推導出 NRDF 的一種新的信息結構。
推導出 NRDF 的新的凸性結果,並利用這些結果將問題轉化為一個無約束的部分可觀測有限時域隨機動態規劃(DP)算法。
提出了一種新的動態交替最小化(AM)方案,通過一個離線訓練算法來逼近控制策略和代價函數。
提出了一個在線(前向)算法來計算上述量的精確值。
通過模擬研究驗證了算法的有效性。
研究意義
本論文的研究成果對於延遲敏感應用(如網絡控制系統、無線傳感器網絡和語義通信)中的零延遲損失壓縮方案的設計和分析具有重要意義。