본 논문에서는 8192 토큰까지 처리 가능한 새로운 다국어 텍스트 인코더를 제시하고, 이를 기반으로 효율적인 텍스트 검색을 위한 표현 모델(TRM)과 재순위 모델을 구축하여, 기존 모델 대비 향상된 성능과 효율성을 보여줍니다.
정보 검색 모델 평가에 사용되는 부분 주석 데이터 세트는 결과의 신뢰성을 저해할 수 있으며, 완전 주석 데이터 세트를 구축하고 활용하는 것이 중요하다.
고밀도 임베딩 기반 검색의 효율성과 정확성을 향상시키기 위해 임베딩 생성과 ANNS 구조를 동시에 최적화하는 새로운 종단 간 계층적 인덱싱(EHI) 방법이 제안되었습니다.
본 논문에서는 궤적 재구성 없이 프로브 지점 위치 데이터를 기반으로 도로 구간의 추정된 프로브 교통량의 정확한 분포를 제시하고, 이를 통해 교통량 추정의 정확도를 높이는 방법을 제시합니다.
VisRAG는 멀티모달 문서에서 시각 정보를 활용하여 검색 및 생성 성능을 향상시키는 새로운 RAG 패러다임입니다.
본 논문에서는 6가지 문서 범주에 걸쳐 10가지 인기 있는 PDF 파싱 도구의 텍스트 추출 및 표 감지 기능을 비교 분석하여 문서 유형에 따라 최적의 도구가 다를 수 있음을 보여줍니다.
본 논문에서는 상품 추천 시스템의 가치를 탐구하며, 특히 선호도 이질성으로 인해 발생하는 문제점과 이를 극복하기 위한 디자인적 접근 방식을 제시합니다.
오디오 검색 엔진 사용자들은 시스템 제약이 없을 때 더 상세한 쿼리를 선호하지만, 실제로는 짧은 키워드 기반 쿼리를 주로 사용하며, 이는 현재 텍스트 기반 오디오 검색 시스템의 개발 방향과 괴리가 있다.
생명의학 연구의 복잡성 증가와 과학 문헌의 상호의존성에 대응하기 위해 PubMed 지식 그래프(PKG) 2.0은 논문, 특허 및 임상 시험을 핵심 데이터로 통합하여 생체 개체, 인용, 저자 및 프로젝트를 통해 이러한 문서 유형 간의 세분화된 연결을 구축합니다.
지시형 대규모 언어 모델(LLM)을 사용하여 대화형 검색의 효율성을 향상시키는 방법을 연구하고, 특히 사용자 발화를 재작성하는 데 효과적인 프롬프트 전략을 제시합니다.