Die Kernaussage dieses Artikels ist die Entwicklung einer neuen Methode zur Objektposenschätzung, die als CPPF++ bezeichnet wird. Im Gegensatz zu bisherigen Ansätzen, die auf realen Trainingsdaten angewiesen sind, verwendet CPPF++ ausschließlich synthetische CAD-Modelle ohne Hintergrundinformationen.
Die Hauptinnovationen von CPPF++ sind:
Probabilistische Modellierung der Stimmenunsicherheit: Anstatt deterministische Stimmenziele vorherzusagen, schätzt das Modell die Wahrscheinlichkeitsverteilung der kanonischen Koordinaten der Punktpaare, um die Robustheit gegenüber Stimmenkollisionen zu erhöhen.
Verwendung von N-Punkt-Tupeln: Anstatt nur Punktpaare zu verwenden, extrahiert das Modell Merkmale aus N-Punkt-Tupeln, um mehr kontextuelle Informationen zu erfassen und die Unterscheidbarkeit zwischen verschiedenen Stimmzielen zu verbessern.
Filterung von verrauschten Tupeln: Eine Modul zur Erkennung und Filterung von verrauschten Tupeln, um den Orientierungsstimmvorgang zu verbessern.
Online-Ausrichtungsoptimierung: Eine differenzierbare Optimierung der Ausrichtung, um die Genauigkeit der Endvorhersage weiter zu verbessern.
Ensemble von Tupel-Merkmalen: Eine Kombination von geometrischen und visuellen Merkmalen, um die Leistung des Modells zu steigern.
Darüber hinaus führt der Artikel einen neuen Datensatz namens DiversePose 300 ein, der eine größere Vielfalt an Posen und Hintergründen bietet als bestehende Datensätze. Die Experimente zeigen, dass CPPF++ die bisherigen Sim-zu-Real-Methoden deutlich übertrifft und sogar mit Methoden, die auf realen Trainingsdaten basieren, vergleichbar oder überlegen ist.
Para outro idioma
do conteúdo fonte
arxiv.org
Principais Insights Extraídos De
by Yang You,Wen... às arxiv.org 04-01-2024
https://arxiv.org/pdf/2211.13398.pdfPerguntas Mais Profundas