이 논문은 의료 보고서를 활용하여 CT 영상과 해부학적 마스크를 동시에 생성하는 새로운 프레임워크 GuideGen을 제안한다.
첫 번째 단계에서는 Volumetric Mask Sampler를 사용하여 의료 보고서 기반의 저해상도 3D 다중 레이블 마스크를 생성한다. 복잡한 복부 영역과 다양한 복부 장기로 인해 일반적인 확산 모델로는 이산적인 데이터 분포를 모델링하기 어려우므로, 범주형 확산 모델(CCDM)을 사용한다.
두 번째 단계에서는 Conditional Image Generator를 사용하여 저해상도 마스크를 기반으로 고해상도 CT 영상을 자동 회귀적으로 생성한다. 공간적 연속성을 보장하기 위해 이전 슬라이스의 CT 영상을 추가 조건으로 사용한다.
정성적 및 정량적 실험 결과, 제안한 GuideGen 프레임워크가 기존 방법들에 비해 높은 성능을 보이며, 의료 영상 분할, 비전-언어 작업 등의 다운스트림 작업에 도움이 될 것으로 기대된다.
Başka Bir Dile
kaynak içeriğinden
arxiv.org
Önemli Bilgiler Şuradan Elde Edildi
by Linrui Dai,R... : arxiv.org 03-13-2024
https://arxiv.org/pdf/2403.07247.pdfDaha Derin Sorular