核心概念
本文介紹了一種新穎的 Schema 推斷方法,將其作為按需函數直接集成到 DBMS 中,目標是解決 NoSQL 資料庫中 Schema 彈性帶來的挑戰。
摘要
將 Schema 推斷作為可擴展 SQL 函數引入 [擴展版本]
這篇研究論文介紹了一種創新的方法,將 Schema 推斷作為一個按需函數直接整合到資料庫管理系統 (DBMS) 中,特別針對 NoSQL 資料庫,因為 NoSQL 資料庫的 Schema 彈性可能會造成挑戰。
本研究旨在解決現有 Schema 推斷方法的效率和可用性限制,這些方法依賴於外部框架,並需要手動將查詢結果具體化以推斷 Schema。其目標是通過在 DBMS 中實現 Schema 推斷作為一個 SQL 函數,使用戶能夠在 DBMS 內原生推斷 Schema,從而提高效率和可用性。
研究人員在 Apache AsterixDB 中實現了他們的 Schema 推斷方法,該方法作為一個 SQL 函數,可以應用於基礎資料集和查詢結果。該實現利用了平行資料庫的架構和演算法,採用兩階段 Schema 發現過程:本地推斷和全域 Schema 合併。本地推斷階段在每個資料分割區中建立本地 Schema,而全域 Schema 合併階段將這些本地 Schema 合併成一個全域 Schema。