본 논문은 산부인과 진료에서 중요한 과제인 초음파 이미지에서 치골 결합과 태아 머리를 자동으로 분할하는 새로운 방법을 제시합니다. 기존의 수동 분할 방식은 시간이 많이 소요되고 주관적이며 관찰자 간 변동성이 크다는 단점이 있습니다. 이를 해결하기 위해 본 논문에서는 양방향 라우팅 어텐션 메커니즘을 갖춘 순수 트랜스포머 아키텍처인 BRAU-Net을 제안합니다.
BRA는 입력 특징 맵을 패치로 분할하고 각 패치에 대해 쿼리, 키, 값을 계산합니다. 그런 다음, 지역 간 라우팅을 통해 의미적으로 관련된 패치를 식별하고, 토큰 간 어텐션을 통해 선택된 패치 내에서 세분화된 특징 표현을 학습합니다.
BRAU-Net은 U-Net과 유사한 인코더-디코더 구조를 가지며, 인코더는 입력 이미지를 저해상도 특징 맵으로 인코딩하고, 디코더는 이를 다시 원래 해상도의 분할 마스크로 디코딩합니다. 각 인코더 및 디코더 단계는 여러 개의 BiFormer 블록으로 구성됩니다.
BiFormer 블록은 BRA 모듈을 기반으로 하며, 3x3 깊이별 합성곱, 계층 정규화, 잔차 연결, MLP 레이어를 포함합니다. 깊이별 합성곱은 로컬 정보를 추출하고, BRA 모듈은 글로벌 컨텍스트를 모델링합니다.
BRAU-Net은 4,000개의 초음파 이미지 데이터셋에서 학습되었으며, 다이스 유사 계수 (DSC) 및 하우스도르프 거리 (HD)를 사용하여 평가되었습니다. 실험 결과, BRAU-Net은 기존 방법들과 비교하여 우수한 분할 성능을 보였습니다.
본 논문에서 제안된 BRAU-Net은 초음파 이미지에서 치골 결합과 태아 머리를 자동으로 분할하는 효과적인 방법입니다. BRAU-Net은 양방향 라우팅 어텐션 메커니즘을 통해 로컬 및 글로벌 컨텍스트 정보를 효과적으로 학습하여 정확한 분할 결과를 얻을 수 있습니다.
翻译成其他语言
从原文生成
arxiv.org
更深入的查询