Conceitos essenciais
대규모 E-commerce 이미지-텍스트 데이터셋인 LGS는 시각적 개념 이해를 위한 중요한 자료를 제공합니다.
Resumo
LGS는 E-commerce 웹사이트에서 수집된 15백만 개의 이미지-캡션 쌍으로 구성되어 있습니다.
E-commerce 데이터의 독특한 분포와 이중 모달 특성은 이미지 분류, 재구성, 이중 표현 학습 및 텍스트-이미지 생성과 같은 응용 프로그램에 유용합니다.
LGS는 기존의 일반 데이터셋과는 다른 카테고리를 가지고 있지만, 시각적 특징 추출기는 공유할 수 있음을 보여줍니다.
Estatísticas
이전의 대규모 이중 모달 데이터셋인 CLIP, ALIGN 및 JFT300M은 공개적으로 접근할 수 없습니다.
LGS는 1,000개 이상의 E-commerce 사이트에서 수집된 15백만 개의 이미지-설명 쌍을 제공합니다.
Citações
"이미지 분류자는 기존 벤치마크 데이터셋에서 E-commerce 데이터로 쉽게 일반화되지 않습니다."
"LGS는 일반 데이터셋과는 다른 라벨 공간을 가지고 있지만, 시각적 특징 추출기는 공유할 수 있습니다."