Core Concepts
地球規模の画像位置推定を高精度で実現する新しいアプローチ
Abstract
本論文では、地球規模の画像位置推定を高精度に行うための新しいアプローチを提案している。
まず、セマンティックなジオセルの作成、マルチタスクの対照学習事前学習、新しい損失関数の導入などの手法を組み合わせた「PIGEON」モデルを開発した。PIGEON は、GeoGuessr ゲームの上位0.01%のプレイヤーを圧倒的に上回るパフォーマンスを示した。
次に、より一般的な画像位置推定を目的とした「PIGEOTTO」モデルを開発した。PIGEOTTO は、既存の画像位置推定ベンチマークデータセットで大幅な精度向上を達成し、特に未知の場所に対する頑健性が高いことが示された。
これらの成果は、地球規模の画像位置推定システムの実現に向けて重要な一歩となる。一方で、このような技術の悪用を防ぐための倫理的な配慮も必要であると指摘している。
Stats
世界中から収集した100,000か所のランダムな位置情報から成る4枚パノラマ画像データセットを使用して、PIGEON モデルを訓練した。
Flickrと Wikipediaから収集した400万枚以上の画像データを使用して、PIGEOTTO モデルを訓練した。
Quotes
「PIGEON は、GeoGuessr ゲームの上位0.01%のプレイヤーを圧倒的に上回るパフォーマンスを示した。」
「PIGEOTTO は、既存の画像位置推定ベンチマークデータセットで大幅な精度向上を達成し、特に未知の場所に対する頑健性が高いことが示された。」