本研究は、3D点群理解のためのIn-Context学習フレームワークを提案している。従来の3D点群解析手法は、個別のタスクに特化したモデルを設計していたが、本研究では、マスクされた点群の復元を通じて、様々な3D点群タスクを統一的に学習できるIn-Context学習フレームワークを開発した。
具体的には以下の3つの貢献がある:
3D点群のIn-Context学習を初めて提案し、Point-In-Context-Generalist (PIC-G)モデルを開発した。PIC-Gは、マスクされた点群の復元を通じて、3D点群の再構築、ノイズ除去、位置合わせ、部分セグメンテーションなどの様々なタスクを学習できる。
部分セグメンテーションタスクの性能と汎化性を向上させるため、In-Context Labelingと In-Context Enhancingの2つの新しい学習手法を提案し、Point-In-Context-Segmenter (PIC-S)モデルを開発した。
ShapeNetPart、Human3D、BEHAVE、AKB-48の4つのデータセットを統合した大規模な3D点群部分セグメンテーションベンチマークを構築し、PIC-Sの有効性を検証した。実験結果から、PIC-Sは既存手法を大きく上回る性能を示し、特に未知のデータセットに対する汎化性が高いことが確認された。
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Mengyuan Liu... at arxiv.org 04-19-2024
https://arxiv.org/pdf/2404.12352.pdfDeeper Inquiries