本研究では、従来の拡散モデル(DDPM)の生成能力と表現学習能力の関係を分解し、生成能力に依存しない新しい自己教師あり表現学習手法であるマスク拡散モデル(MDM)を提案している。
MDMでは、従来のガウシアンノイズ添加の代わりにマスキング操作を導入し、さらにMSEではなくSSIM損失関数を使用することで、下流のセグメンテーションタスクに適した表現を学習する。
実験の結果、MDMは医療画像と自然画像のセグメンテーションタスクにおいて、従来手法であるDDPMやMAEを大きく上回る性能を示した。特に、少数ラベルデータでの性能が優れており、ラベル効率の高さが確認された。
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Zixuan Pan,J... at arxiv.org 04-16-2024
https://arxiv.org/pdf/2308.05695.pdfDeeper Inquiries