본 연구는 심장 초음파 영상 분석을 위한 고품질 대규모 데이터 확보의 어려움을 해결하기 위해 비전-언어 모델을 활용한 합성 데이터 생성 기법을 제안하였다. 구체적으로 세 가지 접근법을 고려하였는데, 1) 무조건부 생성, 2) 텍스트 기반 생성, 3) 텍스트와 의미 레이블 맵 기반 생성이다. 실험 결과, 텍스트와 의미 레이블 맵을 활용한 접근법이 가장 우수한 성능을 보였으며, 이를 통해 생성된 합성 데이터를 활용하여 심장 초음파 영상 분할 및 분류 작업의 성능을 향상시킬 수 있음을 확인하였다. 특히 우심실과 삼첨판 등 기존 모델이 잘 표현하지 못했던 영역에서 성능 향상이 두드러졌다. 이를 통해 제안 기법이 심장 초음파 영상 분석을 위한 고품질 데이터 생성에 효과적임을 입증하였다.
לשפה אחרת
מתוכן המקור
arxiv.org
תובנות מפתח מזוקקות מ:
by Pooria Ashra... ב- arxiv.org 04-01-2024
https://arxiv.org/pdf/2403.19880.pdfשאלות מעמיקות