본 연구 논문에서는 RAG(Retrieval-Augmented Generation) 시스템에서 검색된 지식을 모델링할 때 HTML을 사용하는 것이 일반 텍스트보다 효과적이라는 것을 보여줍니다. 저자들은 HTML이 제목, 표 구조와 같은 HTML 문서에 내재된 구조적 및 의미적 정보를 보존하기 때문에 일반 텍스트보다 우수하다고 주장합니다.
Til et andet sprog
fra kildeindhold
arxiv.org
Vigtigste indsigter udtrukket fra
by Jiejun Tan, ... kl. arxiv.org 11-06-2024
https://arxiv.org/pdf/2411.02959.pdfDybere Forespørgsler