核心概念
フェデレーテッド学習を用いることで、車両のセンサデータを共有することなく、車両ネットワーク内で物体検出モデルを継続的に学習することができる。しかし、クライアント間のデータ分布の違いにより、フェデレーテッド学習の性能が低下する問題がある。本研究では、この問題に対処するため、FedProx+LAと呼ばれる新しい手法を提案し、その有効性を実証する。
摘要
本研究では、完全自動運転を実現するためには、車両の周辺環境を正確に認識するための知覚モデルの継続的なオンライン学習が不可欠であることを述べている。従来の中央集中型の学習では、データ不足により信頼性が低下するため、フェデレーテッド学習が有効な手段となる。
しかし、フェデレーテッド学習では、クライアント間のデータ分布の違い(非IID性)が問題となる。本研究では、この問題に対処するため、FedProxとFedLAを組み合わせた新しい手法FedProx+LAを提案している。
FedProx+LAでは、クライアントの局所更新にプロキシマル項を導入し、さらにラベル分布情報を集約時に考慮することで、データ異質性に強い学習を実現する。
実験では、NuScenesデータセットを用いて、FedProx+LAの有効性を検証している。その結果、FedProx+LAは、従来手法と比較して、物体検出精度(mAP)で最大6%の向上、収束速度で30%の向上を示すことが分かった。特に、ラベル分布が非IIDな場合に、FedProx+LAの優位性が顕著に現れることが確認された。
統計資料
物体検出モデルの精度(mAP)は、IIDデータ分布の場合、0.597であるのに対し、非IIDデータ分布の場合は0.54と低下する。
FedProx+LAは、非IIDデータ分布の場合、mAPが0.577と、従来手法よりも6%高い性能を示す。
FedLA、FedProx+LAは、目標mAP(0.55)を達成するのに必要な global epoch数が、従来手法より30%少ない。
引述
"フェデレーテッド学習を用いることで、車両のセンサデータを共有することなく、車両ネットワーク内で物体検出モデルを継続的に学習することができる。"
"クライアント間のデータ分布の違いにより、フェデレーテッド学習の性能が低下する問題がある。"
"FedProx+LAは、クライアントの局所更新にプロキシマル項を導入し、さらにラベル分布情報を集約時に考慮することで、データ異質性に強い学習を実現する。"