本研究提出了SurGen,這是第一個(據我們所知)以文本引導的擴散模型來生成外科手術影片。SurGen生成的影片具有更高的分辨率和更長的持續時間,展示了擴散模型在外科教育方面的潛力。
本文展示了使用文本倒置法將預訓練的擴散模型適應於不同醫療影像領域的可行性。僅使用100個樣本和單一消費級GPU,即可生成高質量的醫療影像。本文提出的應用包括在低資料情況下增強診斷模型、模擬疾病進程以及生成具有特定疾病特徵的影像。雖然專門為醫療影像訓練的擴散模型可能會產生更優秀的結果,但本文的發現對於計算資源有限的機構仍然很有意義。這種方法特別適用於罕見疾病,因為收集大型數據集在實際中很困難。此外,訓練出的嵌入向量體積小,有利於在保護隱私的情況下共享醫療信息。