Core Concepts
モデル予測における欠損データの影響を評価し、最もロバストな手法を特定する。
Abstract
Francisco Menaらが、地球観測アプリケーションにおける欠損データの影響を評価した研究。
様々なデータセットでトレーニングされたモデルにおいて、一部のデータが欠落した場合の予測品質を比較。
Ensemble戦略が最大100%までの予測ロバスト性を達成し、回帰タスクでは分類タスクよりも欠損シナリオがより困難であることが示唆された。
光学ビューが個別に欠落した場合、最も重要なビューであることが明らかになった。
1. INTRODUCTION
地球観測(EO)における多くのデータ駆動型ソリューションは複数のデータソースから情報を利用している。
データソースが常に利用可能であるという前提は成立しない可能性があり、具体的な状況や課題を考慮する必要がある。
2. MULTI-VIEW LEARNING AND MISSING VIEWS
複数ビュー学習(MVL)設定では、複数のビューを入力として使用し、予測品質を向上させている。
光学やレーダー画像、植生指数、地形情報など異なる視点を表現する特徴やデータソースがビューとして使用されている。
3. EVALUATION
Datasets:
Cropharvest binary (CH-B): 多視点作物認識用のCropharvestデータ。光学・レーダー画像と気象時系列など複数ビューを使用。
Cropharvest multi-crop (CH-M): CH-Bと同じ入力ビューで10クラスの多作物版。
Live fuel moisture content (LFMC): 多視点湿度推定用のLFMCデータ。光学・レーダー時系列と静的ビューを使用。
Crop yield prediction (CYP): 多視点収量推定用のCYPデータ。光学・気象時系列ビューを使用。
Experiment Settings:
入力データにz-score正規化を適用し、カテゴリカル・順序付きビューはone-hot-vectorエンコードされている。
MLPは静的ビュー向けエンコーダとして使用されており、時間的ビューでは1D畳み込みネットワークまたは再帰ネットワークがエンコーダとして使用されている。
Missing View Scenarios:
モデルトレーニング時に全てのビューでトレーニングされたモデルで予測実施。異なる程度の欠落度合いで実験実施。
Experiment Results:
分類タスクおよび回帰タスクにおける予測品質結果示す表あり。Feature fusion技術ではIgnore手法(Feature-avg, Feature-gated)がImputeやExemplarよりも欠損ビューへの影響軽減効果高いこと示唆。
4. CONCLUSION
時系列や静的EOデータに関連するさまざまなタスクでMVLモデル内で欠落したビューストリートメント方法次第で予測品質へ与える影響変わってくること強調。
Stats
Francisco Menaらは地球観測アプリケーションにおける多くの複雑かつ異種な情報源から成り立つ多くは機械学習モデルで取り組まれています
Ensemble戦略は特に100%まで予測ロバスト性を達成します
光学的視点が個別に不足していた場合、最も重要な視点だったことが明らかです