본 연구 논문에서는 침습성 유관암(IDC) 진단을 위한 빠르고 효율적인 잔차 신경망인 BCDNet을 제안합니다. 저자들은 컴퓨터 지원 진단(CAD) 시스템에서 강력한 모델의 중요성을 강조하면서도, 이러한 모델을 다른 의료 기기에 통합하거나 충분한 컴퓨팅 리소스 없이 사용하는 데 어려움이 있다는 점을 지적합니다. 이러한 문제를 해결하기 위해 BCDNet은 잔차 블록, 작은 컨볼루션 블록, 특수 MLP를 사용하여 효율성을 높이고 훈련 소비를 줄이도록 설계되었습니다.
기존의 유방암 진단 방법에는 맘모그래피, 디지털 유방 단층 촬영, 유방 초음파, 자기 공명 영상 등이 있습니다. 그러나 이러한 방법들은 대규모 IDC 사례를 정확하고 신속하게 진단하는 데 어려움을 겪고 있습니다. 딥 러닝 기반 방법, 특히 CNN 기반 방법은 의료 영상 처리 분야에서 유방암 진단을 위해 널리 채택되었습니다. 그러나 이러한 방법들은 종종 풍부한 컴퓨팅 리소스와 대규모 데이터 세트가 부족한 의료 기관에서의 임상 적용을 제한합니다.
BCDNet은 잔차 블록, 컨볼루션 블록, 특수 설계된 다층 퍼셉트론(MLP)으로 구성됩니다. 잔차 블록은 입력 이미지를 업샘플링하여 더 많은 필수적이고 복잡한 특징을 학습할 수 있도록 채널 수를 늘립니다. 컨볼루션 블록은 입력 이미지에서 특징을 추출하고 특징 맵의 공간적 차원을 줄입니다. MLP는 입력 특징과 출력 사이의 비선형 관계를 학습하는 데 사용됩니다.
잔차 블록은 컨볼루션 레이어, 배치 정규화, ReLU 활성화 함수, 잔차 연결로 구성됩니다. 컨볼루션 레이어는 입력 이미지의 채널 수를 늘리고, 배치 정규화는 모델이 더 강력한 특징을 학습하고 수렴 속도를 높일 수 있도록 합니다. ReLU 활성화 함수는 그래디언트 소실 문제를 방지하고, 잔차 연결은 네트워크가 이전 레이어에서 이후 레이어로 정보를 직접 전달할 수 있도록 하여 그래디언트 흐름을 용이하게 하고 매우 깊은 네트워크를 훈련하는 기능을 향상시킵니다.
컨볼루션 블록은 여러 개의 컨볼루션 레이어, 풀링 레이어, 활성화 레이어, 정규화 레이어로 구성됩니다. 풀링 레이어는 특징 맵의 공간적 차원을 줄이고 계산 복잡성을 줄이는 데 도움이 됩니다. 드롭아웃 레이어는 과적합을 방지하고 모델을 더욱 강력하고 가볍게 만듭니다.
MLP는 입력 특징과 출력 사이의 비선형 관계를 학습하는 데 사용됩니다. 드롭아웃 레이어는 과적합을 방지하고 모델을 더욱 강력하고 가볍게 만듭니다. ReLU는 활성화 함수로 사용되어 MLP가 입력 특징과 출력 사이의 더 많은 비선형 관계를 학습할 수 있도록 합니다.
BCDNet의 성능을 평가하기 위해 ResNet50 및 ViT-B-16과 비교 실험을 수행했습니다. 훈련은 2개의 NVIDIA RTX 4090 GPU가 장착된 서버에서 수행되었으며, 교차 엔트로피 손실 함수와 Adam 옵티마이저를 사용했습니다. 학습률은 초기에 0.005로 설정되었으며 수렴을 용이하게 하기 위해 StepLR 스케줄러를 사용했습니다. 본 연구는 kaggle의 IDC 이미지 데이터 세트와 BreaKHis v1 데이터 세트를 기반으로 하며, 정확도, 훈련 시간, 메모리 소비량을 기준으로 모델을 평가했습니다.
본 연구에서는 먼저 kaggle의 IDC 이미지 데이터 세트(본 논문에서는 IDC regular로 명명)를 사용했습니다. IDC regular 데이터 세트는 IDC의 유무를 나타내도록 주석이 달린 RGB 형식의 유방암 조직의 조직병리학적 스캔으로 구성됩니다. 또한 다양한 염색, 배율, 이미징 프로토콜을 포함한 다양한 이미징 조건에서 얻은 여러 유형의 유방암 조직병리학적 이미지로 구성된 BreaKHis v1 데이터 세트도 사용했습니다. 두 데이터 세트는 각각 7:2:1의 비율로 훈련, 검증, 테스트 세트로 나누어 제안된 모델인 BCDNet을 기존 벤치마크와 비교하여 평가할 수 있도록 했습니다.
본 연구에서는 먼저 모든 이미지에 정규화를 적용하여 훈련 속도를 높였습니다. 그런 다음 무작위 수평 및 수직 뒤집기와 무작위 회전을 사용하여 훈련 세트의 다양성을 높였습니다. 마지막으로 입력 차원의 일관성을 보장하기 위해 모든 이미지의 크기를 224 × 224픽셀로 조정했습니다.
모델은 정확도, 훈련 시간, GPU 메모리 소비량을 기준으로 평가했습니다. 각 모델의 효율성을 강조하기 위해 훈련 시간과 메모리 사용량을 모니터링했습니다. 공정한 비교를 위해 독립적인 테스트 세트에서 정확도를 평가했습니다.
실험 결과, BCDNet은 ResNet 50보다 정확도가 약간 낮지만 훈련 시간과 메모리 소비량 측면에서 더 효율적인 것으로 나타났습니다. BCDNet은 에지 장치에 배포하는 데 더 적합하며 새로운 데이터 세트에 맞게 빠르게 수정할 수 있습니다. 또한 BCDNet의 수렴 속도도 더 빨라 손실과 정확도 모두 초기에 안정화되었습니다.
본 논문에서 제안된 BCDNet은 훈련 시간 단축, 메모리 소비량 감소, 높은 수준의 정확도 유지 등 여러 가지 주요 이점을 보여주었습니다. BCDNet은 ResNet 50보다 GPU 메모리를 12.5%, ViT-B-16보다 28.8% 적게 사용하면서도 BreaKHis v1 데이터 세트에서는 평균 1.40배, IDC regular 데이터 세트에서는 1.35배 빠른 속도를 보였습니다. 또한 두 데이터 세트에서 각각 93.8%와 89.3%의 정확도를 달성했습니다. 이러한 결과를 통해 BCDNet이 IDC 진단을 위한 효율적이고 효과적인 모델임을 알 수 있습니다.
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문