本研究では、物体検出タスクのトランスフォーマーモデルにおいて、入力の注意クラスタリングをエントロピーベースで行うENACTモジュールを提案している。
具体的には以下の通り:
提案手法を3つの物体検出トランスフォーマーモデル(DETR、Anchor DETR、Conditional DETR)に適用した結果、GPU メモリ使用量を20-40%、学習時間を5-15%削減できることを示した。一方で、検出精度はわずかに低下するものの(1.5%程度)、依然として既存の物体検出手法を上回る性能を達成できている。
Til et annet språk
fra kildeinnhold
arxiv.org
Viktige innsikter hentet fra
by Giorgos Sava... klokken arxiv.org 09-13-2024
https://arxiv.org/pdf/2409.07541.pdfDypere Spørsmål