関係データベースにおける深層学習モデルの提供は、商業および科学分野の重要な要件となっており、さまざまな代表的なアーキテクチャを包括的に探索する必要がある。
深層学習を用いたデータマッピング手法「DeepMapping」は、データの圧縮率と検索速度のトレードオフを最適化し、メモリ容量が限られた環境でも高速なデータ検索を実現する。
長期的に影響の大きいレコードに対しても、プライバシーを保護しつつ有用な統計を公開する方法を開発した。
銀行顧客の取引履歴、位置情報、テクニカルサポートとの対話などの多様なデータを活用し、顧客ニーズの理解と予測を行う。
本論文では、文字列上のMonadic Second Order (MSO) 問い合わせを効率的に評価するための直接アクセスアルゴリズムを提案する。提案手法は、事前処理段階でデータ構造を構築し、その後の個別アクセス時に高速に問い合わせ結果を取得できる。
GraphArは、データレイクにおけるグラフデータの効率的な管理を可能にする特殊なストレージスキームである。Parquetの機能を活用しつつ、グラフ固有の操作を高速化するための革新的な手法を導入している。
リンクトインのデータを活用することで、組織名の類似性に基づいて効率的にデータをリンクできる。
従来のデータベースクエリ最適化では、CPUとI/Oに関連するコストモデルパラメータを手動で設定する必要があるが、ワークロードの変化に応じて動的に調整することで、より最適なクエリ実行計画を選択できる。
テキストからSQLへの変換とエンドツーエンドのテーブル質問応答の組み合わせにより、テーブルベースの質問応答の性能を向上させる。
大規模言語モデルのテキストからSQLへの変換能力を、ドメインデータベース知識の注入によって強化する。