本論文では、予測不可能な対象の状態を予測する問題を扱う。オンラインレジデュアル学習(ORL)と呼ばれる手法を提案する。ORL は、オフラインで事前に生成された複数の予測モデル(エキスパート)を活用し、それらの予測誤差をオンラインで学習することで、オフラインの知識とオンラインの適応性を組み合わせた予測を行う。
具体的には、以下のような手順で動作する:
この手法は、オフラインの予測モデルを活用しつつ、オンラインで適応できるため、両者の長所を活かすことができる。理論的には、最良のオフラインモデルと最良のオンラインモデルに対する後悔regretを上界評価することができる。
シミュレーション実験では、歩行者軌跡予測問題に適用し、オフラインモデルやオンラインモデルのみを用いる手法と比較して、ORL が優れた性能を示すことを確認した。
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Anastasios V... a las arxiv.org 09-09-2024
https://arxiv.org/pdf/2409.04069.pdfConsultas más profundas