핵심 개념
FedMef는 연합 학습 환경에서 자원 제한적인 디바이스에 특화된 모델을 생성하기 위해 정확도 저하와 높은 활성화 메모리 사용 문제를 해결한다. 예산 인식 압출과 스케일된 활성화 가지치기를 통해 이를 달성한다.
초록
FedMef는 연합 학습 환경에서 자원 제한적인 디바이스에 특화된 모델을 생성하기 위한 메모리 효율적인 동적 가지치기 프레임워크이다.
기존 연합 동적 가지치기 방법들은 가지치기 후 정확도 저하와 높은 활성화 메모리 사용 문제를 겪었다.
FedMef는 이를 해결하기 위해 두 가지 핵심 기술을 제안한다:
예산 인식 압출(Budget-aware Extrusion, BaE): 가지치기 대상 매개변수에서 중요 정보를 추출하여 다른 매개변수로 전달함으로써 가지치기 후 정확도 저하를 최소화한다.
스케일된 활성화 가지치기(Scaled Activation Pruning, SAP): 활성화 메모리 사용을 크게 줄이기 위해 정규화된 희소 컨볼루션(Normalized Sparse Convolution, NSConv)을 활용한다.
FedMef는 CIFAR-10, CINIC-10, TinyImageNet 데이터셋에서 ResNet18과 MobileNetV2 모델을 사용하여 평가되었다. 실험 결과, FedMef는 기존 최신 방법들에 비해 정확도와 메모리 효율성 측면에서 우수한 성능을 보였다.
통계
FedMef는 CIFAR-10 데이터셋에서 MobileNetV2 모델 사용 시 기존 최신 방법 대비 2.13% 정확도 향상과 28.5% 메모리 사용량 감소를 달성했다.
FedMef는 작은 배치 크기에서도 우수한 성능을 보였다. 배치 크기 1에서 FedMef는 다른 방법들보다 높은 정확도를 달성했다.
인용구
"FedMef는 연합 학습 환경에서 자원 제한적인 디바이스에 특화된 모델을 생성하기 위한 메모리 효율적인 동적 가지치기 프레임워크이다."
"FedMef는 예산 인식 압출과 스케일된 활성화 가지치기를 통해 기존 방법들의 정확도 저하와 높은 활성화 메모리 사용 문제를 해결한다."