本研究では、物体検出タスクのトランスフォーマーモデルにおいて、入力の注意クラスタリングをエントロピーベースで行うENACTモジュールを提案している。
具体的には以下の通り:
提案手法を3つの物体検出トランスフォーマーモデル(DETR、Anchor DETR、Conditional DETR)に適用した結果、GPU メモリ使用量を20-40%、学習時間を5-15%削減できることを示した。一方で、検出精度はわずかに低下するものの(1.5%程度)、依然として既存の物体検出手法を上回る性能を達成できている。
In eine andere Sprache
aus dem Quellinhalt
arxiv.org
Wichtige Erkenntnisse aus
by Giorgos Sava... um arxiv.org 09-13-2024
https://arxiv.org/pdf/2409.07541.pdfTiefere Fragen