Core Concepts
異なるアーキテクチャやトレーニング方法を持つビジュアルネットワークが共有プロトコルを自己監督的に開発可能であることを示す。
Abstract
異種ビジュアルネットワークの共同体において、参照通信タスクを探索し、共有プロトコルの形成を実証。
ビジュアルモジュールは凍結され、通信関連パラメータは訓練可能。
一対一および集団訓練セットで高い精度が達成された。
新規エージェントが既存コミュニティのプロトコルを効率的に学習可能であり、集団訓練が優位性を示す。
プロトコルは高レベル意味情報に焦点を当てており、低レベル視覚特徴ではなくそれらを捉えていることが示唆される。
Stats
画像認識チャレンジ(ImageNet)で訓練されたResNet152、Inception、VGG 11などのビジョンモジュール使用。
学習時間:平均9〜28エポックで最大精度到達。
Quotes
"我々は異なる事前学習済みビジュアルモデルに基づくエージェントが成功裏に参照通信プロトコルを導出することが可能であることを示した。"