本論文は、第3回単眼深度推定チャレンジの結果を概説している。前回の2つのチャレンジと同様、このチャレンジでは、複雑な自然および屋内シーンにおける単眼深度推定モデルの零距離一般化能力を評価することが目的だった。今回は、監督付き、自己教師あり、マルチタスクなど、あらゆる形式の学習手法が許可された。
19のチームが基準を上回る成績を収め、そのうち10チームが手法の詳細を報告した。特に優勝チームのPICO-MRは、Depth Anythingモデルをシティスケープデータセットで微調整することで、3D F-Scoreを17.51%から23.72%まで大幅に改善した。これは前回の優勝チームDJI&ZJUを35.5%上回る成績である。
他のトップチームも、Depth Anythingモデルをコアとして活用しつつ、様々な工夫を凝らしており、全体的に大幅な性能向上が見られた。一方で、細かな構造物の推定や不連続面の推定など、依然として課題が残されている。今後の発展に期待がかかる。
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問