核心概念
文字列の置換と交換操作に基づいた新しい編集距離「チルダ距離」を定義し、チルダ等距離単語の完全な特徴付けを行う。
摘要
本論文では、文字列の置換と交換操作に基づいた新しい編集距離「チルダ距離」を定義し、チルダ等距離単語の完全な特徴付けを行っている。
まず、チルダ距離とチルダ変換の定義を行い、その性質を示す。次に、チルダ等距離単語の定義を与え、ハミング等距離単語との関係を明らかにする。
その上で、チルダ等距離単語の完全な特徴付けを行う。具体的には、チルダ非等距離単語は、その重複に特定の構造を持つことを示す。この構造には、1つのチルダ誤差重複、2つのチルダ誤差重複(非隣接エラー)、2つのチルダ誤差重複(隣接エラー)などが含まれる。
この特徴付けにより、チルダ等距離単語の判定が可能となる。また、いくつかの具体的な例も示されている。
統計資料
置換と交換操作を用いた編集距離「チルダ距離」は、ハミング距離よりも一般的である。
チルダ等距離単語とハミング等距離単語は互いに含まれ合わない集合である。
チルダ非等距離単語は、その重複に特定の構造を持つ。
引述
"A word f is tilde-isometric if for any pair of f-free words u and v of length m ≥n, there exists a tilde-transformation from u to v that is f-free."
"A pair (u, v) of words in Σm is a pair of tilde-witnesses for f if: 1. dist∼(u, v) ≥2, 2. u and v are f-free, 3. there exists no f-free tilde-transformation from u to v."