核心概念
等しい要求を持つ要求シーケンスを処理することが、任意の要求シーケンスを処理するよりも困難である。
要約
この論文では、分散ストレージシステムにおけるデータ復旧の問題を扱っている。特に、ユーザーからの要求が等しい場合の困難さに焦点を当てている。
主な内容は以下の通り:
具体的な行列 G について、等しい要求を持つ要求シーケンスを処理することが、ある範囲の要求シーケンスを処理するよりも困難であることを示した。これは「PIRが局所的に最も困難」である結果である。
行列 G がランダムに生成された場合を考え、要求数を行列のサイズで割った値が 1/2 に収束することを示した。これは、等しい要求を持つ要求シーケンスを処理することが、任意の要求シーケンスを処理するのと同程度の困難さであることを意味する。
さらに、要求もランダムな場合を考え、要求が全て同一の固定値である場合が最も困難であることを示した。
論文の中で、Marshall Hall, Jr. の 1952 年の結果を用いて、二倍のバイナリシンプレックス符号が、その長さの半分プラス1の要求シーケンスを処理できることを示した。これは、半分のサーバーを許可する機能的バッチ符号の予想の分数版を意味する。
統計
行列 G の列ベクトルの中で、ある特定のベクトル e が 2m 回以上現れる場合、G は m2^k 機能的バッチ符号となる。
要求シーケンス R を処理するために必要な列数は、2|R| ≤ |G| - N_G(0) + |G ∩ R| 以下である。
引用
"PIRは局所的に最も困難である"
"等しい要求を持つ要求シーケンスを処理することが、任意の要求シーケンスを処理するのと同程度の困難さである"
"要求が全て同一の固定値である場合が最も困難である"