Core Concepts
다중 모달 사전 훈련을 통해 웹페이지 이해를 향상시키는 방법
Abstract
다양한 문서 모달리티의 증가로 인한 자동 문서 이해와 정보 추출에 대한 관심 상승
WebLM을 소개하며 HTML 문서 이미지의 계층 구조를 통합하여 이해를 향상시키는 방법 제안
다양한 사전 훈련 작업을 제안하고 효과적으로 모달리티 간 상호 작용을 모델링
실험 결과는 WebLM이 이전 최신 사전 훈련 모델을 크게 능가함을 보여줌
Stats
다양한 문서 모달리티에 대한 관심 상승
WebLM이 이전 최신 사전 훈련 모델을 크게 능가함을 보여주는 실험 결과
Quotes
"HTML은 외부 파일(JavaScript, CSS, 이미지 등)의 정보를 포함하지 않으므로 실제 웹페이지를 이해하기에는 부족함"
"WebLM은 HTML 구조를 시각적 특징 추출에 통합하여 계층적 시각적 특징을 추출함"