Die Arbeit befasst sich mit der Aufgabe der gemeinsamen Salienz-Objekterkennung (Co-Salient Object Detection, CoSOD). CoSOD zielt darauf ab, die am häufigsten vorkommenden und auffälligsten Objekte in einer Gruppe von Bildern zu erkennen und zu segmentieren.
Zunächst werden die Probleme bestehender CoSOD-Trainingsdatensätze analysiert und Verbesserungsmöglichkeiten aufgezeigt. Es wird ein neuer CoSOD-Trainingsdatensatz namens Co-Saliency of ImageNet (CoSINe) vorgestellt, der der bisher größte Datensatz für CoSOD ist. Experimente zeigen, dass Modelle, die auf CoSINe trainiert wurden, im Vergleich zu allen bisherigen Datensätzen mit deutlich weniger Bildern eine signifikant bessere Leistung erzielen können.
Darüber hinaus wird eine neuartige CoSOD-Methode namens Hierarchical Instance-aware COnsensus MinEr (HICOME) vorgeschlagen, die effizient den Konsensus-Merkmale auf verschiedenen Ebenen abgreift und Objekte unterschiedlicher Klassen in einer objektbezogenen kontrastiven Art und Weise unterscheidet. Umfangreiche Experimente zeigen, dass das vorgeschlagene HICOME-Verfahren die beste Leistung auf allen bestehenden CoSOD-Testdatensätzen erzielt.
Schließlich werden praktische Anwendungen der CoSOD-Technik aufgezeigt und die verbleibenden Herausforderungen und möglichen Verbesserungen von CoSOD diskutiert, um verwandte Arbeiten in der Zukunft anzuregen.
다른 언어로
소스 콘텐츠 기반
arxiv.org
핵심 통찰 요약
by Peng Zheng 게시일 arxiv.org 03-20-2024
https://arxiv.org/pdf/2403.12057.pdf더 깊은 질문