大規模な手動ラベル付けデータセットの必要性を軽減するため、分析による合成を用いて、実際の環境における人間の姿勢と外観の多様性をより正確に捉えることができる、新しい姿勢推定フレームワークを提案する。
本論文では、特徴点の数が増加するにつれて真のカメラ姿勢に収束する、バイアス除去を用いた高精度かつ効率的なPerspective-n-Point (PnP) 解法であるCPnPを提案する。
本稿では、学習ベースのアルゴリズムを新しい設定に直接一般化すると、パフォーマンスが低下する可能性があることを示し、新しいボクセルベースのアルゴリズムであるVoxelKeypointFusionを紹介し、その有効性と汎用性の高さを示しています。
本稿では、姿勢推定における非線形性とセンサーノイズへの課題に対処するため、不変拡張カルマンフィルタ(RI-EKF)に基づく新しい適応型姿勢推定手法を提案しています。
本論文は、四元数左不変EKFと適応的な雑音共分散推定アルゴリズムを統合した姿勢推定手法を提案する。この手法は、未知または時変の真の雑音パラメータ値に対して頑健であり、姿勢推定の精度と堅牢性を向上させる。
小規模なトランスフォーマーベースのモデルの性能を向上させるために、マルチサイクルトランスフォーマー(MCT)モジュールを設計し、自己蒸留フレームワークを提案する。これにより、パラメータと計算量を増やすことなく、小規模モデルの性能を大幅に向上させることができる。