核心概念
一般的なデータセットで事前に訓練された深層ネットワークを、少数のサンプルで新しいタスクに適応させるためのプロンプティングモジュールを設計する。
摘要
本論文では、一般的なデータセットで事前に訓練された深層ネットワークを、少数のサンプルで新しいタスクに適応させるためのプロンプティングモジュールを提案している。
- 提案手法は、パラメトリックな線形モデルと非パラメトリックなランダムフォレストの半パラメトリックな回帰モデルから構成される。
- 学習理論の観点から、提案手法は単純な構造を持つため、同等の訓練誤差を達成しつつ、より良い一般化性能を発揮する。
- ビデオオブジェクトセグメンテーションのケーススタディを通して実験を行い、提案手法が既存の深層学習ベースのアプローチと同等の性能を達成しつつ、極めて低計算コストで実時間処理が可能であることを示している。
統計資料
提案手法は、ビデオの最初のフレームの情報のみを使用して、その後のフレームのオブジェクトセグメンテーションを行う。
提案手法は、ImageNetで事前学習された特徴抽出器を使用し、ランダムフォレストと線形回帰モデルを組み合わせたシンプルな半パラメトリックな回帰モデルを学習する。
提案手法は、DAVIS2016およびDAVIS2017のベンチマークデータセットで、既存の深層学習ベースのアプローチと同等の性能を達成しつつ、極めて高速な処理が可能である。
引述
"Occam's razor principle states that plurality should not be posited without necessity, which is a precursor for rich literature that supports simple math and physics explanation behind the complex phenomenon, as well as later development of learning theory that favors simple models, which are academically measured by VC dimension or Radamecar complexity."
"We tend to transfer those feature extractors from unrelated tasks could boost the performance over handcrafted features, and by comparison, having no way to overfit anything as having no prior information about this task whatsoever."