핵심 개념
신경망이 머신러닝의 중심이 되면서 모델의 복잡성이 증가함에 따라 하드웨어 및 소프트웨어 인프라도 계속 발전하고 있습니다.
초록
신경망의 복잡성 증가로 인한 계산 요구량 및 메모리 풋프린트 증가
모델 병렬화를 통한 계산 요구량 충족
모델 병렬화의 유형 및 도전 과제
현대 모델 병렬화의 사용 사례
자동 및 수동 병렬화 프레임워크 개요
통계
"Megatron-Turing 530B, 2240 A100, 30.2%의 하드웨어 활용도"
"PaLM 540B, 6144 TPUv4, 46.2%의 모델 활용도"
"Gopher 280B, 4096 TPU v3, 32.5%의 데이터 활용도"
인용구
"신경망의 복잡성이 증가하면 계산 요구량과 메모리 풋프린트도 증가합니다."
"모델 병렬화는 신경망의 계산 요구량을 충족시키는 데 도움이 됩니다."