Core Concepts
Fuyouは低コストなトレーニングフレームワークであり、低コストサーバー上の低コストGPUで100B巨大モデルの効率的な微調整を実現します。
Abstract
最近の大規模言語モデルの進歩は、多くのパラメータを利用することから優れた能力をもたらしています。しかし、これらの巨大なモデルを収容するためには多くのGPUからデバイスメモリを集約する必要があります。FuyouはSSD-CPU通信を最適化次元として追加し、計算とデータスワップを最大限に活用します。これにより、Fuyouは低コストサーバー上で100B巨大モデルの効率的な微調整を実現します。
Stats
32 NVIDIA A100 GPUsが必要な1000億パラメータモデル
FuyouはRTX 4090 GPUで175B GPT-3を高いGPU利用率で微調整可能
Quotes
"FuyouはSSD-CPU通信を最適化次元として追加し、計算とデータスワップを最大限に活用します。"
"FuyouはRTX 4090 GPUで175B GPT-3を高いGPU利用率で微調整可能"