本文提出了一種名為 MTCSC 的新方法,用於在速度約束下清理多變量時間序列數據,它克服了現有方法的局限性,並在效率和準確性方面表現出優勢。
本文介紹了一個名為 Modified Detecting Deviating Cells (MDDC) 的新型模式發現方法,用於識別藥物警戒數據中的潛在不良事件。該方法能夠有效地識別與藥物相關的異常高報告數的不良事件。
本文提出了一個中心數據存儲中心的概念,以支持物件導向過程挖掘的動態和可擴展數據準備。
DGRPool是一個網絡工具,可以整合和分析標準化的果蠅遺傳參考群體(DGRP)表型數據,以促進對複雜性狀的新遺傳和分子洞見。
利用不尋常的資料組合可以提高論文的科學影響力和更廣泛的傳播。
本文提出了一個利用循環神經網絡(RNN)的資料庫系統,能夠準確預測龍捲風的發生時間、強度和位置,為可持續城市發展做出貢獻。
本文提出了Structured-GraphRAG框架,旨在通過利用知識圖譜(KG)增強結構化數據的信息檢索。該框架可以自動從結構化數據集中生成KG,並將其與大型語言模型(LLM)相結合,以提高查詢處理效率和響應時間。本文以足球數據為例,展示了Structured-GraphRAG的有效性,並與傳統檢索增強生成(RAG)方法進行了比較。
本文介紹了GraphAr,一種專門為數據湖設計的高效圖形數據存儲方案。GraphAr利用Parquet的優勢,精確捕捉標簽屬性圖(LPG)語義,並支持圖形特定操作,如鄰居檢索和標簽過濾。通過創新的數據組織、編碼和解碼技術,GraphAr大幅提高了性能。
提出一種自適應成本模型(ACM),動態優化與CPU和I/O相關的計劃成本參數,以提高查詢優化器的決策準確性。
提出一種綜合表格問答的方法,通過結合文本到SQL和端到端表格問答模型的優勢來提高表格問答的性能。