PointNetベースの3次元物体検出器では、ポイントプーリングによる情報ボトルネックが性能と拡張性を制限していることを指摘し、Transformerベースの点から体積への特徴集約手法であるPVTransformerを提案する。
提案手法POP-RCNNは、ポイントピラミッド構造を用いて多重スケールのフィーチャーを効果的に融合し、距離に依存しない特徴表現を実現することで、特に遠距離の物体検出精度を向上させる。