本論文では、Traveling Salesman Problem(TSP)を解くための新しいトランスフォーマーモデル「CycleFormer」を提案している。
トランスフォーマーモデルをTSPに適用する際の課題を特定し、それらを十分に考慮したモデル設計を行っている。具体的には以下の点に注目している:
言語モデルにおけるトークンセットとは異なり、TSPのトークン(ノード)セットは無制限かつ動的である。このことを最大限に活用するため、エンコーダの出力をデコーダの線形層に等しくし、エンコーダのコンテキストベクトルをデコーダのエンコーディングに直接接続している。
エンコーダにはTSPの2次元的性質を反映するための空間位置エンコーディングを、デコーダにはツアーの巡回性を考慮した円形位置エンコーディングを導入している。
トランスフォーマーの最終線形層をエンコーダの出力(Dynamic Embedding)に置き換えることで、トークンの意味的関係をより適切に捉えられるようにしている。
これらの工夫により、CycleFormerは従来のトランスフォーマーベースのTSPソルバーを大きく上回るパフォーマンスを発揮している。特に、TSP-500では最適解との差(optimality gap)を約2.8倍改善し、1.10%まで縮小することに成功している。
Para Outro Idioma
do conteúdo original
arxiv.org
Principais Insights Extraídos De
by Jieun Yook, ... às arxiv.org 10-01-2024
https://arxiv.org/pdf/2405.20042.pdfPerguntas Mais Profundas