מושגי ליבה
CLIPはBLVユーザーの画像において性能が低下し、その原因を明らかにする。
תקציר
CLIPはBLVユーザーの画像で15%の精度低下があることが示された。
CLIPは障害物体や画質、テキスト内容に敏感であることが示唆された。
多様な大規模データセットへのアクセスがパフォーマンス向上に寄与することが示された。
モデル適応やアプリケーションレベルの解決策が提案された。
סטטיסטיקה
BLVユーザーから収集した画像では、CLIPの精度は平均して15ポイント低い。
LAION-400M、LAION-2B、DataComp-1Bなどのデータセットでは障害物体は非障害物体よりも17倍少なく言及されている。