まばらな屋内測位データから、過去の特定時点における特定区画の人口を確率的にモデル化し、さらにそのモデルを用いてリアルタイムに将来の人口を予測する手法を提案する。
SQLのgroup-byとaverageを用いた集約ビューの結果を理解することは、特に大規模なデータセットでは困難な場合があります。CauSumXは、因果関係に基づいた要約された説明を生成することで、ユーザーが結果をより深く理解し、データ分析を効率化することを支援します。
香港の証券先物委員会(SFC)の公開記録を用いたネットワーク分析により、香港の金融エコシステムの構造、専門家の移動、企業のダイナミクスが明らかになり、金融業界の構造と進化についての貴重な洞察を提供する。
EUFCC-CIRは、GLAM(博物館、図書館、文書館、美術館)コレクションの複合画像検索のためのデータセットである。EUFCC-340Kデータセットを基に、自動化されたプロセスとフィルタリングヒューリスティックスを使用して、クエリ画像、テキストモディファイア、関連ターゲット画像の豊富で多様なセットを作成した。
本論文では、周辺分布の再構築を効率的かつ非公開に行うための原理的で実用的な手法を提案する。提案手法は、最近の研究で導入された残差クエリーに基づいており、高次元データに対しても計算量が指数的にならない。さらに、局所的な非負制約を導入することで、再構築された周辺分布の精度を向上させることができる。
動的な環境でのオブジェクト指向プロセスマイニングをサポートするための、柔軟でスケーラブルなデータベースフォーマットの提案
確率的に既知のイベントログから上位K個の実現を効率的に計算するアルゴリズムを提案し、その有用性を評価する。
ドロソフィラ遺伝的参照パネル(DGRP)の表現型データを統合し、ユーザーが簡単にダウンロードしたり、GWAS、PheWAS、表現型相関などの解析を行えるWebツールを開発した。
食事と腸内細菌叢の関係は健康に重要であり、この関係に関する知見を科学文献から抽出することが本研究の目的である。
関係データベースにおける深層学習モデルの提供は、商業および科学分野の重要な要件となっており、さまざまな代表的なアーキテクチャを包括的に探索する必要がある。