Core Concepts
FreeMan ist ein großer, vielseitiger Datensatz für 3D-Körperhaltungsschätzung, der reale Szenarien mit unterschiedlichen Beleuchtungsbedingungen, Hintergründen und Kameraeinstellungen abdeckt. Der Datensatz ermöglicht die Entwicklung robusterer Modelle für die Körperhaltungsschätzung in der Praxis.
Abstract
Der Artikel präsentiert FreeMan, einen neuartigen, großen Datensatz für die 3D-Körperhaltungsschätzung unter realen Bedingungen. Im Gegensatz zu bestehenden Datensätzen, die meist in kontrollierten Laborsituationen aufgenommen wurden, umfasst FreeMan 11 Millionen Frames aus 8.000 Sequenzen, die von 8 Smartphones in 10 verschiedenen Szenarien mit unterschiedlichen Beleuchtungsbedingungen und Hintergründen aufgezeichnet wurden.
Der Datensatz bietet eine große Vielfalt an Körperhaltungen, Aktionen und Kameraeinstellungen, was ihn besonders geeignet für die Entwicklung und Evaluierung von Algorithmen zur 3D-Körperhaltungsschätzung in realen Umgebungen macht. Um die Skalierbarkeit und Genauigkeit der Annotation zu erhöhen, wurde ein semi-automatisches Annotationspipeline entwickelt, das manuelle Korrekturen ermöglicht.
Der Artikel stellt vier Benchmark-Aufgaben vor, die mit FreeMan evaluiert werden können: monokulare 3D-Körperhaltungsschätzung, 2D-zu-3D-Anhebung, multiview 3D-Körperhaltungsschätzung und neuronale Rendering von Personen. Die Ergebnisse zeigen, dass Modelle, die auf FreeMan trainiert wurden, eine deutlich bessere Übertragbarkeit auf reale Szenarien aufweisen als Modelle, die auf anderen Datensätzen trainiert wurden.
Stats
Die Entfernung der Kameras zum Systemzentrum variiert zwischen 2 und 5,5 Metern.
Die Fläche der umgebenden Begrenzungsboxen der Personen beträgt zwischen 0,01 und 0,7 der Gesamtbildfläche.
Quotes
"FreeMan ist der derzeit größte Mehrfachansichts-Datensatz für 3D-Körperhaltungsschätzung, mit variablen Kameraparametern und komplexen Umgebungsbedingungen."
"FreeMan umfasst 11 Millionen Frames aus 8.000 Sequenzen, die 40 Personen in 10 verschiedenen Szenarien zeigen."