Ein lernbares Modul namens Adaptives Diskretes Disparitätsvolumen (ADDV) ermöglicht es einem Netzwerk, dynamisch Bins zu generieren und Wahrscheinlichkeitsverteilungen für Samples entsprechend der Eingabebilder zu schätzen, ohne zusätzliche Supervision.
Die Autoren schlagen zwei neue Verlustfunktionen vor, um die Konsistenz über verschiedene Ansichten hinweg bei der selbstüberwachten monokularen Tiefenschätzung zu verbessern: Depth Feature Alignment (DFA) Loss und Voxel Density Alignment (VDA) Loss. Diese Verlustfunktionen sind robuster gegenüber Herausforderungen wie Beleuchtungsschwankungen, Verdeckungen und bewegte Objekte im Vergleich zu herkömmlichen Ansätzen.