本研究では、ビジョン-言語モデルを活用して高品質な心エコー図合成データを生成する手法を提案している。具体的には以下の3つのアプローチを検討した:
テキストプロンプトとセマンティックラベルマップを組み合わせた手法が最も優れた性能を示し、FIDやKIDなどの評価指標で従来手法を大きく上回った。また、生成データを心エコー図の分類と分割タスクに活用したところ、データ拡張によって精度が向上し、収束も速くなることが確認できた。特に、テキストプロンプトのみを用いた手法が最も高い分類精度を達成した。
本研究の成果は、ビジョン-言語モデルを活用した心エコー図合成データの生成が、下流タスクの性能向上に寄与することを示している。今後は、より複雑な心エコー図の生成や、動画合成への応用などが期待される。
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Pooria Ashra... at arxiv.org 04-01-2024
https://arxiv.org/pdf/2403.19880.pdfDeeper Inquiries