본 논문에서는 대규모 데이터셋에서 스카이라인 쿼리의 성능을 향상시키기 위해 다양한 분할 전략과 최적화 기법을 제시하고, 이들의 효율성을 실험적으로 비교 분석합니다.
객체 중심 프로세스의 이벤트 로그를 추출하는 새로운 방법론인 Dirigo는 OCEL 2.0 표준을 준수하는 고품질 로그 표현을 생성하고, 실제 활용 사례를 통해 그 효과를 입증합니다.
본 논문에서는 대규모 공간 데이터셋에서 효율적인 조인 가능 검색을 위한 새로운 프레임워크를 제시하며, 특히 중첩 및 커버리지 기반의 두 가지 조인 가능 검색 문제(OJSP, CJSP)를 정의하고, 이를 해결하기 위한 분산 인덱싱 및 검색 알고리즘을 제안합니다.
데이터베이스 작업에 머신러닝 모델을 적용할 때 데이터 분포 변화에 대한 모델의 성능을 이론적으로 분석하고, 학습된 모델이 기존 방식보다 우수한 성능을 보이는 조건과 그 이유를 밝힙니다.
본 논문은 양자 어닐링 기술을 데이터베이스 최적화 문제에 적용하는 방법을 소개하고, 실제 데이터 관리 시스템에서 양자 컴퓨팅의 가능성과 미래 연구 방향을 제시합니다.
팔란티어가 2024년 3분기 실적 발표에서 예상을 뛰어넘는 매출 성장을 기록하며 AI 기업으로서의 입지를 굳혔다.
본 연구는 IMDb 및 Netflix 데이터를 사용하여 영화 및 OTT 산업 내 배우들의 협업 패턴을 분석하고, 중심 배우와 산업 트렌드를 파악하며 언어 기반 협업 경향을 강조합니다. 또한, 향후 협업 가능성을 예측하고 세계 영화 산업 내에서의 Bollywood의 위치를 조명합니다.
희소한 실내 위치 데이터를 사용하여 실내 공간의 특정 시간대 인구 분포를 정확하게 모델링하고 예측하는 방법을 제시합니다.
대규모 언어 모델(LLM)을 활용하여 데이터 클리닝 작업의 정확도와 효율성을 향상시키는 새로운 시스템인 Cocoon을 소개하고, 기존 시스템과의 비교를 통해 Cocoon의 우수한 성능을 입증한다.
속성 레이블의 의미 정보를 활용한 데이터 품질 평가 방법을 통해 기존 방식보다 누락된 값을 포함한 데이터 품질 문제를 효과적으로 식별하고 해결할 수 있습니다.