生成検索では、文書を一意に識別するDocIDを生成することが重要である。従来の手法では、DocIDを単一の自然言語シーケンスとして定義していたが、これは誤った打ち切りの問題に悩まされていた。本研究では、DocIDを用語集合として定義し、順列不変のデコーディングアルゴリズムを提案することで、この問題を解決した。さらに、モデルが好ましい順列でDocIDを生成するよう誘導する反復最適化手順を導入した。