Fusion-in-T5는 텍스트 매칭, 순위 특징, 전체 문서 정보를 하나의 통합된 모델에 결합하여 문서 순위 결정 성능을 크게 향상시킨다.
정보 검색 시스템은 단순한 관련성 뿐만 아니라 사용자의 다양한 관점을 인식하고 반영해야 한다.
제너레이티브 관련 피드백과 적응형 재순위화를 활용하여 검색 성능을 향상시킬 수 있다.
랜덤 문서를 포함하는 것이 LLM의 정확도를 크게 향상시킬 수 있다.
강력한 크로스-인코더 랭커의 일반화를 향상시키기 위해서는 고품질 키워드 생성과 최소한의 쿼리 변경이 필요하다.
확률적 구조화 질의(PSQ)는 정렬된 코퍼스에서 통계적으로 도출된 번역 확률을 사용하는 다국어 정보 검색(CLIR) 방법이다. PSQ는 희소 색인을 사용하는 효율적인 CLIR을 위한 강력한 기준선이며, 더 효과적이지만 대규모 텍스트 컬렉션 검색에는 비효율적인 신경망 CLIR 시스템의 첫 단계로 유용하다.
KamerRaad는 대규모 언어 모델을 활용하여 시민들이 벨기에 정치 정보와 상호 작용할 수 있도록 지원하는 AI 도구입니다. 이 도구는 국회 회의록에서 핵심 발췌문을 추출하고 간단히 요약하며, 사용자의 이해를 높이기 위한 대화형 상호 작용을 제공합니다.
사용자가 원하지 않는 정보를 명시적으로 제외하는 배제적 정보 검색 기술을 소개하고, 이를 위한 데이터셋과 모델 성능 분석을 제공한다.
검색 기반 생성 모델의 성능 향상을 위해 검색 결과 품질을 평가하는 새로운 접근법을 제안한다. 기존 방식과 달리 생성 모델이 각 검색 결과를 활용하여 생성한 출력을 평가함으로써 검색 모델의 성능을 더 정확하게 측정할 수 있다.
SPLADE 모델의 효율성을 높이기 위해 두 단계 접근법을 제안한다. 첫 번째 단계에서는 SPLADE 벡터를 더 희소하게 만들고 가중치를 재조정하여 효율성을 높이고, 두 번째 단계에서는 원본 SPLADE 벡터를 사용하여 상위 k개 문서를 다시 점수화한다.