Core Concepts
論文は、CDAWGを使用して最小不在単語(MAW)と拡張特別因子(EBF)を効率的に計算する方法に焦点を当てています。
Abstract
この論文では、文字列Sに対する非自明なMAWの探索やデータ構造の提案が行われています。Fujishigeらが提案したデータ構造に基づくアルゴリズムや、CDAWGを使用したよりスペース効率の良いデータ構造について述べられています。さらに、MAWやMRWがEBFと密接な関係を持つことも示されています。
Stats
Fujishige et al. [TCS 2023]は、長さnの文字列SのすべてのMAWsセットMAW(S)をO(n + |MAW(S)|)時間で出力するサイズΘ(n)のデータ構造を提案しました。
CDAWGに基づくよりスペース効率の良いデータ構造は、O(|MAW(S)|)時間でMAW(S)を出力し、emin空間で動作します。
Quotes
"Finding such non-trivial MAWs for a given string is motivated for applications in bioinformatics and data compression."
"We also show that MAWs and their generalization minimal rare words have close relationships with extended bispecial factors, via the CDAWG."