核心概念
ノイズ除去型拡散モデルと流れ場予測モデルを組み合わせることで、実際の細胞顕微鏡動画から学習し、注釈付きの合成動画を生成できる。これにより、深層学習ベースの細胞分割・追跡手法の性能を向上させることができる。
要約
本研究では、ノイズ除去型拡散モデル(DDPM)と流れ場予測モデル(FPM)を組み合わせた「Biomedical Video Diffusion Model (BVDM)」を提案している。
DDPMを用いて細胞の質感を学習し、リアルな細胞画像を生成する。
FPMを用いて連続フレーム間の非剛体変形を学習し、時間的整合性のある動画を生成する。
実際の細胞顕微鏡動画から学習したBVDMを用いて、注釈付きの合成動画を生成する。
合成動画を使って細胞分割・追跡モデルを学習すると、実データのみを使う場合よりも高い性能が得られる。
BVDM は、従来のGANベースの手法に比べて、より高品質な合成動画を生成できる。また、実データが限られる生物医学分野において、合成データを活用することで深層学習モデルの性能を大幅に向上させることができる。
統計
細胞分割精度(SEG)は、実データを使った場合が0.823に対し、BVDMを使った場合は0.829と向上した。
細胞追跡精度(TRA)は、実データを使った場合が0.976に対し、BVDMを使った場合は0.979と向上した。
Fréchet Video Distance(FVD)は、BVDMが79.4と最も低い値を示し、生成動画の高い現実感を示している。
Fréchet Inception Distance(FID)は、BVDMが29.6と最も低い値を示し、生成画像の高い現実感を示している。