Die Arbeit befasst sich mit der Aufgabe der gemeinsamen Salienz-Objekterkennung (Co-Salient Object Detection, CoSOD). CoSOD zielt darauf ab, die am häufigsten vorkommenden und auffälligsten Objekte in einer Gruppe von Bildern zu erkennen und zu segmentieren.
Zunächst werden die Probleme bestehender CoSOD-Trainingsdatensätze analysiert und Verbesserungsmöglichkeiten aufgezeigt. Es wird ein neuer CoSOD-Trainingsdatensatz namens Co-Saliency of ImageNet (CoSINe) vorgestellt, der der bisher größte Datensatz für CoSOD ist. Experimente zeigen, dass Modelle, die auf CoSINe trainiert wurden, im Vergleich zu allen bisherigen Datensätzen mit deutlich weniger Bildern eine signifikant bessere Leistung erzielen können.
Darüber hinaus wird eine neuartige CoSOD-Methode namens Hierarchical Instance-aware COnsensus MinEr (HICOME) vorgeschlagen, die effizient den Konsensus-Merkmale auf verschiedenen Ebenen abgreift und Objekte unterschiedlicher Klassen in einer objektbezogenen kontrastiven Art und Weise unterscheidet. Umfangreiche Experimente zeigen, dass das vorgeschlagene HICOME-Verfahren die beste Leistung auf allen bestehenden CoSOD-Testdatensätzen erzielt.
Schließlich werden praktische Anwendungen der CoSOD-Technik aufgezeigt und die verbleibenden Herausforderungen und möglichen Verbesserungen von CoSOD diskutiert, um verwandte Arbeiten in der Zukunft anzuregen.
翻譯成其他語言
從原文內容
arxiv.org
從以下內容提煉的關鍵洞見
by Peng Zheng 於 arxiv.org 03-20-2024
https://arxiv.org/pdf/2403.12057.pdf深入探究