Any2Point ist ein parametersparsames Verfahren, um Vortrainingsmodelle beliebiger Modalitäten (Vision, Sprache, Audio) für das 3D-Verständnis zu nutzen.