本論文では、DNA ストレージシステムにおける情報の保存と復元に関する問題を扱う。従来の研究では、情報文字列全体が観測されることを前提としていたが、実際のDNA シーケンシング技術では、文字列の部分文字列しか観測できない。このため、部分文字列からの情報復元が課題となる。
本論文では、置換ノイズまたは削除ノイズが存在する状況を考える。2つのノイズモデルについて、エラー訂正に利用可能な符号族を検討し、その符号サイズの組合せ論的な上界を示す。
繰り返し文字列の一般化概念を用いて、部分文字列長の誤り率が十分小さいか、部分文字列長が十分長い場合には、このチャネルモデルによる冗長度の増加は漸近的に無視できることを示す。さらに、一部のケースでは効率的なエンコーダも提案する。
最後に、二次構造の形成を回避するためのエンコーダも提案する。これは上述のチャネルモデルと密接に関連している。
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Yonatan Yehe... lúc arxiv.org 03-27-2024
https://arxiv.org/pdf/2102.01412.pdfYêu cầu sâu hơn