แนวคิดหลัก
제안된 하이브리드 관계 할당 기법은 기존 DETR 기반 장면 그래프 생성 모델의 느린 수렴 문제를 해결한다. 이를 통해 모델은 더 적은 에폭으로도 최신 성능을 달성할 수 있다.
บทคัดย่อ
이 논문은 단일 단계 장면 그래프 생성 모델인 Hydra-SGG를 소개한다. Hydra-SGG의 핵심은 하이브리드 관계 할당 기법이다. 이 기법은 기존의 one-to-one 관계 할당과 새로운 one-to-many 관계 할당을 결합한다.
one-to-many 관계 할당은 각 ground truth 관계를 여러 개의 관계 쿼리에 할당함으로써 긍정 샘플의 수를 늘린다. 이를 통해 sparse 관계 감독 문제를 완화할 수 있다.
또한 Hydra Branch라는 보조 디코더를 도입하여, 서로 다른 쿼리가 동일한 관계를 예측하도록 장려함으로써 one-to-many 관계 할당을 더욱 강화한다.
실험 결과, Hydra-SGG는 VG150, GQA, Open Images V6 데이터셋에서 최신 성능을 달성하면서도 훈련 시간을 크게 단축할 수 있었다.
สถิติ
한 이미지당 평균 5.5개의 ground truth 관계 triplet만 존재하는 VG150 데이터셋에서, Hydra-SGG는 기존 one-to-one 할당 대비 긍정 샘플을 65.5% 늘릴 수 있었다.
Hydra-SGG는 VG150 테스트 셋에서 mR@50 16.0을 달성하여 최신 성능을 기록했다. 이는 이전 최고 성능 대비 3.6 포인트 향상된 결과이다.
Hydra-SGG는 VG150, GQA, Open Images V6 데이터셋에서 각각 12, 12, 7 에폭만에 최신 성능을 달성했다. 이는 기존 방법들 대비 훨씬 빠른 수렴 속도이다.
คำพูด
"Hydra-SGG achieves state-of-the-art performance with 10.6 mR@20 and 16.0 mR@50 on VG150, while only requiring 12 training epochs."
"Hydra-SGG not only achieves state-of-the-art results on the challenging VG150 [68] but also exhibits a remarkably fast convergence rate. It converges faster than existing one-stage SGG counterparts [6, 37, 18] with 10× fewer training epochs."