핵심 개념
다중 스케일 저주파 메모리 네트워크(MLFM)는 합성곱 신경망의 저주파 정보 보존을 향상시켜 성능을 개선한다.
초록
본 연구는 합성곱 신경망(CNN)의 저주파 정보 처리 능력 향상을 위해 다중 스케일 저주파 메모리 네트워크(MLFM)를 제안한다. MLFM의 핵심은 저주파 메모리 유닛(LFMU)으로, 이는 다양한 저주파 데이터를 저장하고 핵심 네트워크와 병렬 채널을 형성한다. LFMU는 5가지 게이트로 구성되며, 웨이블릿 변환을 활용하여 저주파 정보를 추출하고 메모리 유닛을 통해 CNN의 성능을 향상시킨다. MLFM은 기존 네트워크 구조를 변경하지 않고 플러그인 방식으로 적용 가능하다. ImageNet 실험에서 ResNet, MobileNet, EfficientNet, ConvNeXt 등 다양한 2D CNN 모델의 정확도가 크게 향상되었다. 또한 FCN, U-Net 등 이미지-이미지 변환 작업에서도 MLFM의 우수성이 입증되었다. 이를 통해 MLFM이 제한된 자원에서 CNN의 효과와 효율을 최적화하는 데 중요한 진전을 이루었음을 보여준다.
통계
기존 CNN 구조에서는 고주파 정보(텍스처, 가장자리 등)에 편향되어 저주파 정보(전체 구조, 색상 등)를 효과적으로 학습하지 못한다.
MLFM을 ResNet18에 적용하면 ImageNet100 데이터셋에서 정확도가 77.86%에서 81.22%로 3.36% 향상된다.
MLFM을 FCN_ResNet과 U-Net 모델에 적용하면 Cityscapes 데이터셋에서 의미 분할 성능이 크게 향상된다.
인용구
"CNN은 고주파 정보(텍스처, 가장자리 등)에 편향되어 저주파 정보(전체 구조, 색상 등)를 효과적으로 학습하지 못한다."
"MLFM은 기존 네트워크 구조를 변경하지 않고 플러그인 방식으로 적용 가능하다."