核心概念
訓練資料的文化和社會經濟多樣性對於視覺語言模型的效能和公平性至關重要,僅使用英文資料訓練會損害模型理解和詮釋來自不同文化背景的視覺和文字資料的能力。
標題: 無濾鏡:對比式視覺語言模型中的文化和社會經濟多樣性
作者: Angéline Pouget, Lucas Beyer, Emanuele Bugliarello, Xiao Wang, Andreas Peter Steiner, Xiaohua Zhai, Ibrahim Alabdulmohsin
發表: NeurIPS 2024
本研究旨在探討訓練資料的文化和社會經濟多樣性如何影響對比式視覺語言模型(VLMs)的效能,特別關注僅使用英文資料訓練模型所帶來的潛在偏差。