核心概念
本稿では、離散的なマルコフ情報源を対象とした、遅延のない可変レートの非予測的レート歪み関数(NRDF)の計算手法を提案し、その性能をシミュレーションにより評価しています。
摘要
マルコフ情報源における非予測レート歪み関数の有限時間動的計画法による解析
本論文は、離散時間、ゼロ遅延、可変レートの損失性圧縮問題において、ステージごとに単一文字の歪みを持つ離散マルコフ情報源を対象とした場合の、非予測的レート歪み関数(NRDF)を用いた非漸近的な下限の計算について論じています。
導入
従来の損失性符号化問題では、長いブロックのソースシンボルを符号化し、漸近的にシャノンの限界を最小のビットレートで達成します。しかし、この手法は符号化遅延が大きいため、遅延に敏感なアプリケーションには適していません。一方、ゼロ遅延損失性符号化問題は、情報源シンボルの圧縮シンボルを遅延なく生成し、離散的なノイズレスチャネルを介してデコーダに送信することで、遅延なく情報源シンボルを再構成します。
貢献
本論文では、ステージごとの平均単一文字歪み基準の下で、離散的で時間的に変化する可能性のあるマルコフ情報源を想定し、離散時間、ゼロ遅延、可変レートの損失性ソース符号化システムの経験的レートに対する非漸近的な下限を解析します。
- まず、特定のクラスの情報源と忠実度制約に対して、NRDF を用いて得られる下限の構造的性質を導出します(補題1)。
- 次に、得られた最適化問題の汎関数を特徴付ける新しい凸性特性を導出します(定理2、3)。これらの特性を活用し、連続状態空間を持つ制約のない部分観測可能な有限時間水平確率的動的計画法(DP)アルゴリズムとして問題を定式化します(式(13)、(14))。
- DP アルゴリズムを直接解くのではなく、制御ポリシー(本稿では NRDF の最小化分布に対応)に関して最適化を行い、時間的に後方に得られる暗黙的な閉形式の漸化式を求めます。
- これらの漸化式は、新しい動的AMスキーム(補題4)を提案することで計算されます。このスキームは、各時間段階で連続状態空間を有限状態空間に離散化することにより、制御ポリシーとコスト関数(レートの関数)をオフラインで近似します(アルゴリズム1)。
- さらに、任意の有限時間水平に対して動作するオンライン(フォワード)アルゴリズム(アルゴリズム2)を提案し、前述の量の正確な値を計算します。
数値例
本論文では、提案されたアルゴリズム1、2を裏付ける数値シミュレーションを提供しています。具体的には、2つの例を挙げ、どちらも2値アルファベット空間を想定しています。
結果
シミュレーションの結果、提案手法は、従来の手法と比較して、計算量が少なく、かつ、より正確な下限を提供することが示されました。
結論
本論文では、離散マルコフ情報源に対するNRDFの最適化を、連続状態を持つ制約のない部分観測可能な有限時間水平確率的DPアルゴリズムとして再定式化し、新しい動的AMスキームを用いて制御ポリシーを近似する手法を提案しました。この手法は、従来のBlahut-Arimotoアルゴリズム(BAA)を一般化したものであり、オフライン学習アルゴリズムとオンライン計算によって実現されます。
统计
本論文では、時間変化する2値マルコフ過程と時間不変の2値マルコフ過程を想定してシミュレーションを実施しています。
シミュレーションでは、信念状態空間の探索範囲を20〜100の範囲で変化させています。
アルゴリズムの実装には、並列処理を用いることで、計算量の削減を図っています。
引用
"To the best of our knowledge, this is the first paper in which (i) the optimization of NRDF for discrete Markov sources and single-letter distortion is reformulated as an unconstrained partially observable finite-time horizon stochastic DP algorithm with continuous state; (ii) the control policy is approximated by means of a novel dynamic AM scheme realized via an offline training algorithm that generalizes the known Blahut-Arimoto algorithm (BAA) [26], followed by an online computation."