本文提出了一種名為深度學習資料映射(DeepMapping)的新抽象,它利用深度神經網路的出色記憶能力,可以提供更好的存儲成本、更低的延遲和更小的運行時內存占用,同時實現無損壓縮和高效查詢。
DeepMapping將數據集轉換為多個鍵值映射,並構建一個多任務神經網絡模型,該模型可以輸出給定輸入鍵的相應值。為了處理記憶錯誤,DeepMapping將學習的神經網絡與一個輕量級輔助數據結構耦合,該結構能夠糾正錯誤。輔助結構的設計還使DeepMapping能夠有效地處理插入、刪除和更新,而無需重新訓練映射。
作者提出了一種基於深度強化學習的多任務混合架構搜索(MHAS)算法,該算法可以自適應地調整共享和專有層的數量和大小,以最小化混合架構的整體大小。
此外,作者還提出了支持插入、刪除和更新的工作流程,通過將修改操作具體化到輔助結構中來實現。只有當輔助結構的大小超過一定閾值時,才會觸發神經網絡模型的重新訓練。
作者在TPC-H、TPC-DS、合成數據集和實際農作物數據集上進行了廣泛的實驗。結果表明,與現有方法相比,DeepMapping在有限內存容量的情況下能夠實現高達15倍的查詢加速,同時也能提供更好的存儲效率。
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Lixi... lúc arxiv.org 09-27-2024
https://arxiv.org/pdf/2307.05861.pdfYêu cầu sâu hơn