本研究では、地理空間機械学習予測の評価において重要な役割を果たすサンプルデータと予測位置の類似性を定量化する新しい方法を提案した。提案手法は敵対的検証に基づいており、特徴空間の情報を活用することで、類似性を0%から100%の範囲で定量化できる。
実験では、合成データと実データを用いて、徐々に類似性が変化する予測タスクを構築した。その結果、提案手法は類似性を効果的に定量化できることが示された。さらに、類似性と交差検証(CV)手法の評価パフォーマンスの関係を分析した。その結果、類似性が低い場合(30%未満)はランダムCVが最も優れた評価を提供し、類似性が高くなるにつれ(80%以上)空間CVが優れるようになることが明らかになった。一方、中間的な類似性範囲(50%-90%)では、どのCV手法も十分な評価を提供できないことが分かった。
これらの結果は、地理空間機械学習予測の評価において、特徴空間の類似性を考慮することの重要性を示している。また、本研究で提案した類似性定量化手法は、適切なCV手法の選択に役立つと考えられる。今後の研究では、より広範な類似性範囲で正確な評価を提供できる自己適応型のCV手法の開発に取り組む必要がある。
In eine andere Sprache
aus dem Quellinhalt
arxiv.org
Wichtige Erkenntnisse aus
by Yanwen Wang,... um arxiv.org 04-22-2024
https://arxiv.org/pdf/2404.12575.pdfTiefere Fragen