SwIPE는 의료 영상 분할을 위한 새로운 접근법으로, 기존의 이산적 표현 방식에서 벗어나 암묵적 신경 표현을 활용한다.
먼저 입력 영상을 다중 스케일 특징 맵으로 인코딩하고, 이를 통해 전체 영상 및 패치 단위의 형상 임베딩을 생성한다. 이 때 다중 스케일 정보를 효과적으로 융합하기 위해 Multi-stage Embedding Attention (MEA) 모듈을 제안한다.
다음으로 생성된 임베딩과 좌표 정보를 활용하여 패치 단위와 전체 영상 단위에서 각각 점-단위 점유율을 예측한다. 이 과정에서 패치 간 경계 불연속성을 해결하기 위해 Stochastic Patch Overreach (SPO) 기법을 도입한다.
실험 결과, SwIPE는 기존 암묵적 및 이산적 분할 방법들을 크게 능가하며, 매개변수 수와 계산량 측면에서도 월등한 성능을 보인다. 또한 데이터 변화에 대한 강건성과 데이터/모델 효율성 측면에서도 우수한 결과를 달성한다.
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문