本文提出了一種名為EarthGen的新型框架,用於生成無限大小、高分辨率的地球表面影像。EarthGen結合了階層式和組合式生成方法的優點,能夠在不同尺度上生成高度真實和一致的地表特徵。
具體來說,EarthGen包含以下三個關鍵組件:
基礎層模型:使用潛在擴散模型(Latent Diffusion Model)無條件地生成低分辨率的地表基礎層。
級聯超分辨率模組:採用一系列潛在擴散超分辨率模組,逐步增加分辨率並引入合理的細節特徵。模組之間通過負向條件編碼來確保全局一致性。
擴散混合瓦片拼接:使用擴散混合的方法將鄰近瓦片拼接在一起,確保整體輸出的連貫性和一致性。
通過這種方法,EarthGen能夠生成覆蓋數千平方公里、分辨率高達15cm/像素的地球表面影像,在宏觀和微觀層面都展現出極高的真實性和多樣性。
此外,本文還展示了EarthGen在可控世界生成和3D場景生成等應用中的潛力。
翻譯成其他語言
從原文內容
arxiv.org
深入探究