희소한 실내 위치 데이터를 사용하여 실내 공간의 특정 시간대 인구 분포를 정확하게 모델링하고 예측하는 방법을 제시합니다.
대규모 언어 모델(LLM)을 활용하여 데이터 클리닝 작업의 정확도와 효율성을 향상시키는 새로운 시스템인 Cocoon을 소개하고, 기존 시스템과의 비교를 통해 Cocoon의 우수한 성능을 입증한다.
속성 레이블의 의미 정보를 활용한 데이터 품질 평가 방법을 통해 기존 방식보다 누락된 값을 포함한 데이터 품질 문제를 효과적으로 식별하고 해결할 수 있습니다.
대규모 데이터셋에서 SQL group-by-average 쿼리 결과를 이해하는 것은 어려울 수 있으므로, 본 논문에서는 전체 집계 뷰에 대한 요약된 인과 관계 설명을 생성하는 CauSumX 프레임워크를 제안합니다.
본 논문에서는 복잡한 네트워크 분석을 통해 홍콩 증권선물위원회(SFC) 공개 등록 데이터를 활용하여 홍콩 금융 생태계의 구조와 역학 관계를 분석하고, 이를 통해 금융 산업의 인사이트를 도출하고자 합니다.
HyperBlocker는 규칙 기반 블로킹 기술을 GPU에서 효율적으로 실행하여 엔티티 결합 속도를 향상시키는 시스템입니다.
대규모 언어 모델과 지식 그래프의 통합은 데이터 관리 분야에 새로운 기회를 제공한다.
이 연구는 비다항식 계수를 가진 "변형된" 이중 수렴 Heun 방정식의 급수 해법을 제시한다. 이를 통해 복잡한 시공간 배경에서 스칼라장 방정식의 해를 구할 수 있다.
차원이 높은 데이터셋에서 효율적이고 사적인 방식으로 마진 질의를 재구성하는 방법을 제안한다.
이 논문은 명목 변수로 구성된 이원 분할표에서 파워-발산 유형 측정을 사용하여 대칭성 이탈을 평가하는 새로운 대응 분석 방법을 제안한다.