核心概念
アドバーサリーが未知の言語Kを提示する中で、アルゴリズムは最終的にKから未見の文字列を生成することができる。
要約
この論文では、未知の言語Kからの文字列生成に関する新しい理論的枠組みを提案しています。
まず、従来の言語同定の問題では、アドバーサリーが言語Kの文字列を順次提示する中で、アルゴリズムがKを特定することが不可能であることが知られています。一方、本論文では、言語生成の問題を考えます。ここでは、アルゴリズムの目標は、Kから未見の文字列を生成することです。
具体的には、以下のような手順で進みます。
- 言語集合Cは、未知の言語Kを含む可算無限個の言語から構成される。
- アドバーサリーがKの文字列を順次提示する中で、アルゴリズムは、Cに含まれる言語の中から、提示された文字列に整合的な言語(consistent language)を特定する。
- アルゴリズムは、consistent languageの中で最も高いインデックスを持つ言語Lntから、未提示の文字列を生成する。
- 時間の経過とともに、Lntはやがてzのインデックスを持つ真の言語Kに収束する。
- その後、アルゴリズムは確実にKから未見の文字列を生成し続けることができる。
このように、言語同定の問題とは対照的に、言語生成の問題では、可算無限個の言語集合Cに対して、アルゴリズムが常に生成可能であることが示されています。この違いは、言語生成と言語同定が本質的に異なる問題であることを示唆しています。
統計
以下の文章が重要な数値情報を含んでいます:
言語集合Cは可算無限個の言語から構成される。
アルゴリズムは最終的にKから未見の文字列を生成し続けることができる。