核心概念
クラウドオブジェクトストレージ(COS)でのニアデータコンピューティング技術を用いて、転移学習(TL)のトレーニング時間を大幅に短縮できる。
要約
クラウドオブジェクトストレージにおけるニアデータコンピューティングによる転移学習の高速化
書誌情報: Diana Petrescu, Arsany Guirguis, Do Le Quoc, Javier Picorel, Rachid Guerraoui, and Florin Dinu. "Accelerating Transfer Learning with Near-Data Computation on Cloud Object Stores." SoCC ’24, November 20–22, 2024, Redmond, WA, USA.
研究目的: ストレージの分離によるネットワークボトルネックを軽減するため、クラウドオブジェクトストレージ(COS)でのニアデータコンピューティング技術を用いて、転移学習(TL)のトレーニング時間を高速化することを目的とする。
手法: 本論文では、TLのDNNをストレージ層と計算層に分割し、ストレージ側で特徴抽出の一部を実行する新しいTLファインチューニングシステムであるHapiを提案する。Hapiは、(1) DNN分割と(2)ストレージ側バッチサイズ適応という2つの新しい技術を用いることで、ネットワーク転送を削減し、トレーニング時間を短縮し、COSでのプッシュダウンの同時実行性を向上させる。
主な結果: Hapiは、トレーニング時間を最大2.5倍高速化し、86.8%のケースで最適な分割点または最適な分割点から最大5%以内の分割点を選択することを示した。
結論: 本研究は、分離されたCOS上でのTLにニアデータコンピューティング技術を適用することの利点を示し、TLトレーニングの高速化とリソース効率の向上に貢献するものである。
意義: 本研究は、大規模データセットを用いた機械学習の効率的なトレーニング手法を提供することで、クラウドベースの機械学習サービスの普及と発展に貢献する。
限界と今後の研究: 本研究では、画像分類タスクに焦点を当てている。今後の研究では、他の機械学習タスクに対するHapiの有効性を評価する必要がある。また、異なるCOS環境におけるHapiのパフォーマンスへの影響についても検討する必要がある。
統計
ネットワーク帯域幅の成長は、ストレージ帯域幅とコンピューティングスループットの成長に比べて遅れている。
最新のNVMe SSDは、10 GBpsをはるかに超える速度でシーケンシャルに読み取ることができる。
PCIe 5.0 NVMe SSDのアレイは、読み取りスループットで100 GBpsを超えることができる。
DRAMの読み取りは、十分なスレッド並列性があれば100 GBpsを超え、パーシステントメモリの読み取りは30 GBpsを超えることができる。
Hapiは、トレーニング時間を最大2.5倍高速化し、86.8%のケースで最適な分割点または最適な分割点から最大5%以内の分割点を選択する。