Concepts de base
BiGRは、コンパクトなバイナリ潜在コードを用いた新しい条件付き画像生成モデルであり、生成と表現学習の両方の能力を強化することに重点を置いています。
Hao, S., Liu, X., Qi, X., Zhao, S., Zi, B., Xiao, R., Han, K., & Wong, K-Y. K. (2024). BiGR: Harnessing Binary Latent Codes for Image Generation and Improved Visual Representation Capabilities (arXiv:2410.14672). arXiv. https://arxiv.org/abs/2410.14672
本研究は、高品質な画像生成と優れた視覚表現学習の両方を達成できる、統一された条件付き画像生成モデルの開発を目的としています。