本研究では、物体検出タスクのトランスフォーマーモデルにおいて、入力の注意クラスタリングをエントロピーベースで行うENACTモジュールを提案している。
具体的には以下の通り:
提案手法を3つの物体検出トランスフォーマーモデル(DETR、Anchor DETR、Conditional DETR)に適用した結果、GPU メモリ使用量を20-40%、学習時間を5-15%削減できることを示した。一方で、検出精度はわずかに低下するものの(1.5%程度)、依然として既存の物体検出手法を上回る性能を達成できている。
Vers une autre langue
à partir du contenu source
arxiv.org
Questions plus approfondies