본 논문에서는 로마자 표기 벵골어와 영어가 혼합된 코드 혼합 대화에서 관련 정보를 추출하는 데 GPT-3.5 Turbo 모델과 순차적 엔지니어링 접근 방식을 활용하는 방법을 제시합니다.
본 논문에서는 진화하는 문서 코퍼스에서 재현 가능한 검색 결과를 얻기 위해 랭크 기반 검색 엔진(Lucene)과 버전 관리된 컬럼 스토어 데이터베이스(MonetDB)를 결합한 하이브리드 시스템을 제안합니다.
대규모 언어 모델(LLM)을 사용하여 생성된 합성 쿼리 변형을 데이터 융합 기술과 결합하면 정보 검색 효율성을 크게 향상시킬 수 있습니다.
고정된 랭크-1 조합 행렬에서 생성된 꼬인 중앙화기 코드는 뛰어난 오류 정정 능력을 지닌 MDS (Maximum Distance Separable) 코드이지만, 낮은 정보 전송률과 제한적인 메시지 코드 용량을 나타냅니다.
본 연구는 오픈액세스 저널의 지역적 및 학문적 범위를 OpenAlex, Scopus, WoS 세 가지 데이터베이스를 비교 분석하여 OpenAlex의 포괄성을 강조하면서도 각 데이터베이스의 고유한 특징과 한계점을 제시합니다.
계량서지학 지표의 불확실성
본 논문에서는 사용자의 제어를 가능하게 하는 개인 맞춤 검색 모델인 CtrlCE를 제안하며, 이 모델은 편집 가능한 사용자 프로필과 교차 인코더를 결합하여 검색 성능과 사용자 제어 기능을 모두 향상시킵니다.
본 논문에서는 다양한 검색 작업, 다중 모달 쿼리 및 문서를 처리할 수 있는 범용 다중 모달 검색을 위해 다중 모달 대규모 언어 모델(MLLM)을 활용하는 방법을 제안합니다.
본 연구는 도메인 특정 엔터프라이즈 데이터 세트에서 교차 인코더 재순위 지정 모델의 성능을 향상시키기 위해 앙상블 임베딩을 사용한 강력한 하드 네거티브 마이닝 기술을 제안합니다.
본 논문에서는 히타이트 쐐기 문자의 효율적인 검색 및 디지털 표현을 위해 기존 방식의 문제점을 분석하고, 이를 개선하는 새로운 재귀적 인코딩 시스템인 '카다루' 시스템을 제안합니다.