본 연구 논문에서는 RAG(Retrieval-Augmented Generation) 시스템에서 검색된 지식을 모델링할 때 HTML을 사용하는 것이 일반 텍스트보다 효과적이라는 것을 보여줍니다. 저자들은 HTML이 제목, 표 구조와 같은 HTML 문서에 내재된 구조적 및 의미적 정보를 보존하기 때문에 일반 텍스트보다 우수하다고 주장합니다.
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Jiejun Tan, ... lúc arxiv.org 11-06-2024
https://arxiv.org/pdf/2411.02959.pdfYêu cầu sâu hơn