本研究は、RGBT追跡における注目すべき課題である固定フュージョン構造の限界に取り組む。提案手法AFterは、階層的注意ネットワーク(HAN)を設計し、異なるフュージョン単位を組み合わせることで、動的にフュージョン構造を最適化する。具体的には、HAN内には4つの注意力ベースのフュージョン単位が含まれており、それらを組み合わせることで様々なフュージョン構造を構築できる。さらに、各フュージョン単位にはルーターが埋め込まれており、フュージョン構造の重み付けを動的に予測することで、効率的な最適化を実現する。
実験では、5つの主要なRGBT追跡データセットにおいて、提案手法AFterが最先端のRGBT追跡手法を大きく上回る性能を示した。特に、複雑な追跡シナリオにおいて、AFterの動的フュージョン構造が大きな優位性を発揮することが確認された。
Egy másik nyelvre
a forrásanyagból
arxiv.org
Mélyebb kérdések