본 연구는 심장 초음파 영상 분석을 위한 고품질 대규모 데이터 확보의 어려움을 해결하기 위해 비전-언어 모델을 활용한 합성 데이터 생성 기법을 제안하였다. 구체적으로 세 가지 접근법을 고려하였는데, 1) 무조건부 생성, 2) 텍스트 기반 생성, 3) 텍스트와 의미 레이블 맵 기반 생성이다. 실험 결과, 텍스트와 의미 레이블 맵을 활용한 접근법이 가장 우수한 성능을 보였으며, 이를 통해 생성된 합성 데이터를 활용하여 심장 초음파 영상 분할 및 분류 작업의 성능을 향상시킬 수 있음을 확인하였다. 특히 우심실과 삼첨판 등 기존 모델이 잘 표현하지 못했던 영역에서 성능 향상이 두드러졌다. 이를 통해 제안 기법이 심장 초음파 영상 분석을 위한 고품질 데이터 생성에 효과적임을 입증하였다.
To Another Language
from source content
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Pooria Ashra... lúc arxiv.org 04-01-2024
https://arxiv.org/pdf/2403.19880.pdfYêu cầu sâu hơn