생명의학 연구의 복잡성 증가와 과학 문헌의 상호의존성에 대응하기 위해 PubMed 지식 그래프(PKG) 2.0은 논문, 특허 및 임상 시험을 핵심 데이터로 통합하여 생체 개체, 인용, 저자 및 프로젝트를 통해 이러한 문서 유형 간의 세분화된 연결을 구축합니다.
지시형 대규모 언어 모델(LLM)을 사용하여 대화형 검색의 효율성을 향상시키는 방법을 연구하고, 특히 사용자 발화를 재작성하는 데 효과적인 프롬프트 전략을 제시합니다.
AI 생성 이미지가 구글 이미지 검색 결과를 장악하면서 실제 이미지를 찾기 어려워졌고, 이는 인터넷 환경과 정보 검색에 대한 우려를 불러일으킨다.
비용이 많이 드는 제품 반품이 있는 경우, 검색 순위가 높은 기업이 반드시 더 높은 수익을 얻는 것은 아니며, 오히려 불리할 수도 있다.
본 논문에서는 그래프 거리 개념을 기반으로 하는 오류 정정 코드인 오류 정정 그래프 코드를 구성하고, 이러한 코드의 최적 rate-distance tradeoff를 분석하며, 다양한 구성 기법을 통해 높은 거리를 갖는 명시적 코드를 제시합니다.
Vec2Text는 모델 가중치에 대한 접근 없이도 대량의 악의적인 구절을 생성하여 검색 결과를 조작하는 코퍼스 포이즈닝 공격에 활용될 수 있으며, 이는 기존의 검색 시스템에 심각한 위협을 초래할 수 있다.
본 논문에서는 대규모 고품질 합성 데이터 세트를 자동으로 구축하여 기존 법률 사례 검색 시스템의 성능을 향상시키는 방법을 제시합니다.
본 논문에서는 274년 분량의 미국 신문 이미지 데이터를 기반으로 이미지, 캡션, 시간 정보를 모두 활용하는 새로운 멀티모달 검색 과제인 TRIC를 소개하고, 이를 기반으로 진행된 대회 결과 및 데이터셋 분석 내용을 제시합니다.
본 논문에서는 대규모 언어 모델(LLM)을 활용하여 사용자의 자연어 질문을 정확한 SPARQL 쿼리로 변환하는 시스템을 소개하고, 이 시스템이 생물정보학 분야의 연합 지식 그래프에서 효과적으로 작동함을 보여줍니다.
본 논문은 전자상거래 분야의 정보 검색에 대한 포괄적인 개요를 제공하며, 사용자 행동 모델링, 검색 및 추천 시스템, 질의응답 및 대화 시스템을 포함한 다양한 측면을 다룹니다.