Concepts de base
본 연구에서는 N4 바이어스 필드 보정 및 이방성 확산 전처리 기법을 사용하여 MRI에서 뇌 조직을 자동으로 분할하는 다양한 방법론(확률론적 아틀라스, U-Net, nnU-Net, LinkNet)을 비교 분석한 결과, 3D nnU-Net 모델이 가장 우수한 성능을 보였다.
Résumé
N4 바이어스 필드 보정 및 이방성 확산 전처리 기법을 사용한 MRI 기반 자동 뇌 조직 분할을 위한 확률론적 아틀라스 및 딥러닝 접근 방식 비교 연구
자기 공명 영상(MRI)에서 자동 뇌 조직 분할은 의료 영상에서 정확한 진단 및 추가 분석에 필수적입니다. 본 연구에서는 N4 바이어스 필드 보정 및 이방성 확산과 같은 전처리 기법을 사용하여 기존의 통계적 방법(확률론적 아틀라스)과 최신 딥러닝 접근 방식(U-Net, nnU-Net, LinkNet)을 비교 분석합니다.
데이터셋
본 연구에서는 Massachusetts General Hospital에서 제공하는 공개적으로 사용 가능한 데이터 세트인 IBSR18 데이터 세트를 사용했습니다. 데이터 세트는 다양한 슬라이스 두께와 간격을 가진 18개의 T1 가중 볼륨으로 구성됩니다. 18개 샘플 중 8개 볼륨은 훈련, 2개 볼륨은 검증, 5개 볼륨은 테스트에 사용되었습니다.
전처리
균일하고 정밀한 조직 분할을 얻는 데 어려움이 있기 때문에 전처리 단계가 중요합니다. IBSR18의 볼륨은 이미 두개골이 제거되었으므로 두개골 제거를 수행하지 않았습니다. 그러나 N4 바이어스 필드 보정을 사용하여 바이어스 필드를 수정했으며 이방성 확산을 사용하여 모든 볼륨의 강도를 추가로 노이즈 제거했습니다.
패치 추출
고차원 이미지로 딥러닝 모델을 훈련하려면 항상 관리하기 어려운 강력한 계산 리소스와 시간이 필요합니다. 본 연구에서는 U-Net, nnU-Net, LinkNet과 같은 딥러닝 아키텍처를 사용했으며 훈련 중 계산 복잡성을 줄이기 위해 훈련 하위 집합에서 해당 Ground Truth와 함께 전체 3D 볼륨에서 크기 32 × 32의 작은 패치를 추출했습니다.
데이터 증강
데이터 증강은 기존 이미지에 다양한 변환을 적용하여 훈련 하위 집합을 인공적으로 확장하는 딥러닝의 중요한 프로세스입니다. 본 연구에서는 8개 볼륨으로 구성된 훈련 하위 집합을 사용하여 U-Net 및 LinkNet 모델의 훈련을 최적화하는 데 중점을 두었습니다. 표준 훈련-검증 분할을 준수하여 검증을 위해 2개 볼륨을 할당했습니다. 구현된 데이터 증강 전략에는 회전, 너비 및 높이 이동, 전단 변환, 크기 조정, 수평 및 수직 뒤집기와 같은 다양한 변환이 포함됩니다.
확률론적 아틀라스를 사용한 뇌 조직 분할
아틀라스는 특히 MR 영상에서 뇌 조직 분할의 맥락에서 의료 영상 및 계산 해부학의 중요한 도구입니다. 템플릿이라고 하는 강도 이미지와 아틀라스 레이블이 포함된 해당 분할 이미지의 조합입니다. 이미지를 분할하기 위해 이미지는 처음에 이 템플릿에 정렬되거나 등록됩니다. 등록 후 얻은 변환은 아틀라스 레이블에 반대로 적용됩니다. 이러한 역 적용으로 대상 이미지에 대한 분할 결과가 생성되며, 이는 레이블 전파라고 하는 전체 프로세스를 구성합니다. 레이블 전파에 사용되는 접근 방식은 사용된 아틀라스 유형에 따라 다를 수 있습니다. 아틀라스는 토폴로지 아틀라스와 확률론적 아틀라스의 두 가지 주요 범주로 분류할 수 있습니다.
본 연구에서는 데이터 세트의 모든 이미지를 공통 참조 이미지에 정렬하고 레이블을 이 공유 등록 공간으로 전송한 후 확률론적 아틀라스를 구현했습니다. 정렬 프로세스 중 참조 이미지 선택은 훈련 이미지 간의 상호 정보를 계산하는 것을 기반으로 했습니다. 그런 다음 전송된 레이블을 평균 기법(즉, 각 클래스에 대해 전송된 레이블의 평균 계산) 또는 각 voxel에 가장 많이 나타나는 레이블을 할당하는 다수 투표를 사용하여 병합할 수 있습니다. 아틀라스를 구성하는 프로세스에는 일반적으로 다음 세 가지 주요 단계가 포함됩니다.
이미지 등록: 훈련 데이터의 모든 이미지의 조직 영역 voxel을 정렬하기 위해 수행됩니다. 이미지를 등록하기 위해 상호 정보를 기반으로 고정 이미지를 선택했으며 훈련 세트의 다른 모든 이미지는 이동 이미지로 간주되어 고정 이미지에 대해 등록하여 공통 공간에 정렬했습니다. 이미지 등록을 수행하는 데 여러 도구와 접근 방식을 사용할 수 있지만 본 연구에서는 Rigid, Affine, B-Spline과 같은 다양한 등록 매개변수를 사용하여 SimpleITK Elastix를 사용하여 뇌 이미지 등록을 더 잘 미세 조정하고 최상의 결과를 얻었습니다.
레이블 전파: 등록 후 후
딥러닝을 사용한 뇌 조직 분할
딥러닝은 복잡한 신경망 아키텍처를 활용하여 대규모 데이터 세트에서 학습합니다. 제한된 양의 데이터가 있기 때문에 처음에는 확률론적 아틀라스를 기반으로 통계적 접근 방식을 구현하여 기준 결과로 사용하고 딥러닝 접근 방식의 상태를 더 잘 비교했습니다. 딥러닝 방법론에서는 최상의 결과를 얻기 위해 다양한 하이퍼 매개변수 튜닝과 함께 여러 아키텍처(U-Net, LinkNet, nnU-Net)를 구현했습니다. 이 프로세스는 다음과 같이 달성되었습니다.
U-Net 하이퍼 매개변수 튜닝: 첫 번째 딥러닝 분할 모델로 U-Net 아키텍처를 사용했지만 업샘플링 섹션 내에 많은 수의 특징 채널을 포함하도록 수정했습니다. 이러한 추가 특징 채널을 통해 네트워크는 컨텍스트 정보를 고해상도 레이어로 전파할 수 있습니다. 그런 다음 사용자 지정 모델과 사전 훈련된 백본이 있는 모델을 포함하여 세 가지 U-Net 아키텍처를 살펴보았습니다. 첫 번째 모델은 가장 간단하며 각 단계(인코딩, 병목 현상 및 디코딩)에 단일 2D Convolution 레이어와 표준 업샘플링 및 스킵 연결이 있습니다. 두 번째 모델은 각 단계에 두 개의 2D Convolution 레이어를 추가하고 공간 정보를 유지하기 위해 특징을 병합하는 연결 작업을 통합하여 아키텍처의 복잡성을 증가시킵니다. 마지막으로 세 번째 모델은 각 2D Convolution 레이어 이후에 추가 연결 단계를 도입하여 특징 통합을 향상시키는 가장 복잡한 모델입니다. 이러한 세 가지 사용자 지정 U-Net 모델 외에도 대규모 ImageNet 데이터 세트를 사용하여 사전 훈련된 백본이 있는 U-Net 아키텍처로 확장했습니다. 먼저 사전 훈련된 ResNet34 및 ResNet50 모델을 U-Net 모델의 백본(인코딩 경로)으로 사용하여 이미지에서 특징을 추출했습니다. 디코더 경로는 기존 U-Net 아키텍처와 동일하게 유지되며, 이 아키텍처는 업샘플링 레이어와 컨볼루션 프로세스를 사용하여 원하는 마스크를 제공합니다. 사전 훈련된 백본을 통합하면 U-Net 아키텍처가 더욱 복잡해지고 분할 결과가 향상됩니다.
LinkNet 하이퍼 매개변수 튜닝: LinkNet은 빠른 계산 용량으로 인해 실시간 의미 분할에 특히 사용되는 매우 효율적인 딥러닝 모델입니다. 다른 분할 모델과 마찬가지로 LinkNet 아키텍처는 인코더와 디코더의 두 가지 주요 부분으로 구성됩니다. ResNet 아키텍처를 기반으로 하는 인코더는 3 × 3 커널 크기의 레이어를 사용하여 차원을 줄이면서 고급 특징을 포착합니다. 반면에 디코더는 가벼움에 중점을 두고 업샘플링 레이어와 1 × 1 컨볼루션을 사용하여 자세한 분할 맵을 재구성합니다. 이 작업에서는 U-Net 아키텍처 하이퍼 매개변수 튜닝의 단계와 유사하게 인코더 부분에서 백본으로 사전 훈련된 ResNet34 모델을 사용했습니다.
nnU-Net: nnU-Net은 특히 생물 의학 영상 분야에서 의미 분할에 널리 사용됩니다. 이 모델은 새로운 작업에 대해 전처리 방법, 네트워크 아키텍처, 훈련 절차 및 후처리 기법을 사용자 지정하여 자율적으로 적응하고 최