YORO는 데이터베이스 지식을 모델 내부에 직접 내재화하여 입력 길이를 크게 줄이면서도 기존 방식과 경쟁력 있는 성능을 달성한다.
panCAKES는 데이터의 저차원 구조를 활용하여 데이터를 효율적으로 압축하고 압축된 데이터에서 k-NN 및 ρ-NN 검색을 수행할 수 있는 일반적인 접근 방식을 제공한다.
센서스 마이크로데이터 복원 공격인 신뢰도 순위 복원(CRR)은 개인정보 보호에 실질적인 위협이 되지 않는다.
지원 대상 객체 모델에서 m개 이하의 요소로 지원되는지 테스팅하는 문제의 복잡한 행동을 분석하고 있다. 특히 적응형 테스팅에 대한 문제를 다루고 있다.
PANDA 알고리즘은 Shannon 부등식을 기반으로 하여 데이터베이스 쿼리의 출력 크기를 예측하고, 이를 바탕으로 효율적인 쿼리 평가 방법을 제공한다.
SeLeP는 데이터 값의 인코딩을 활용하여 데이터 접근 패턴을 학습하고 예측함으로써 데이터 탐색 작업의 응답 시간을 향상시킨다.
펜실베이니아 대학교에서 개발한 오픈소스 클라우드 기반 과학 데이터 관리 플랫폼 Pennsieve는 신경과학 데이터의 통합, 공유 및 분석을 지원하여 협력 연구 생태계를 조성한다.
데이터 품질 향상을 위해 도메인 지식 없이도 결과에 대한 설명과 해석이 가능한 포괄적인 프레임워크를 제안한다.
국가별 맞춤형 기계 학습 모델을 활용하여 식량 소비 점수를 예측함으로써 기근 예측 정확도를 높이고 효과적인 인도주의적 개입을 가능하게 한다.
데이터 중심 설계 모델을 통해 데이터 보안, 상호운용성, 확장성 향상