核心概念
本文探討如何在資料空間中整合先進的密碼技術(如安全多方計算和全同態加密),以實現安全可靠的資料共享,並探討無需信任的資料中介機構在其中的角色和挑戰,最後透過實際案例分析提出一個綜合架構,為在動態、無需信任的資料環境中實施和標準化安全計算技術鋪平道路。
Secure Computation and Trustless Data Intermediaries in Data Spaces
本文探討如何在資料空間中整合先進的密碼技術,以實現安全可靠的資料共享,這對於不斷發展的資料經濟至關重要。此外,本文還探討了歐盟資料治理法中概述的資料中介機構在資料空間中的作用,並特別介紹了無需信任的中介機構的概念,這些中介機構無法訪問其用戶的資料。為此,我們利用了所介紹的安全計算方法,即安全多方計算 (MPC) 和全同態加密 (FHE),並討論了其安全優勢。總體而言,我們確定並解決了整合面臨的主要挑戰,重點關注身份管理、策略執行、節點選擇和訪問控制等領域,並透過空中交通管理、製造和二次資料使用等實際案例提出了解決方案。此外,透過對實際應用的分析,這項工作為在動態、無需信任的資料環境中實施和標準化安全計算技術提出了一個綜合架構,為未來安全且可互通的資料生態系統的研究和發展鋪平了道路。
資料空間是實現主權、可互通和值得信賴的資料共享的核心,這對於新興的資料經濟至關重要。儘管資料空間本身就具備某些支援資料主權的技術,但使用超越現有技術的現代密碼學可以將這一概念提升到一個新的水平,並釋放敏感資料的協作潛力。
在本文中,我們重點關注用於加密資料計算的隱私增強技術 (PET),而無需信任任何第三方或特定硬體;即多方計算 (MPC) 和全同態加密 (FHE)。MPC 是一種分散式協定,它自然適合資料空間的聯合架構,因此可以成為其組成部分。另一方面,FHE 可以在不訪問私鑰的情況下對加密資料進行計算,因此也可以在兩個資料空間參與者之間直接使用。FHE 的通信開銷比 MPC 小,但它在單個伺服器上需要的計算量比 MPC 多。
據我們所知,目前還沒有關於 MPC 和 FHE 在資料空間中的綜合分析或整合概念,除了我們在 [44] 中提出的初步方法,特別是在支援現代協作用例方面。
我們要強調的是,也存在其他安全計算範例——包括例如可信執行環境 (TEE) 或聯邦學習 (FL)——它們在效率和頻寬要求方面部分優於 FHE 或 MPC。然而,本文重點關注這兩種原語的原因有兩個。首先,像 FL 這樣的方案是為要執行的特定計算量身定制的,而 FHE 和 MPC 在表達能力方面是通用的。其次,特別是在基於硬體的 TEE(例如 Intel SGX5 或 ARM TrustZone6)的情況下,不僅需要信任密碼機制,還需要信任硬體製造商,這為風險評估帶來了全新的維度,尤其是在高度監管的領域,例如與患者健康資料相關的領域。
1.1 我們的貢獻
因此,在本文中,我們系統地分析了將多方計算 (MPC) 和全同態加密 (FHE) 整合到資料空間中所面臨的挑戰,以便能夠以保護隱私的方式無縫地訪問安全計算技術來處理敏感資料。
此外,我們還分析了資料中介機構在促進資料空間內端到端安全資料共享和處理方面的潛力,從而解決了與資料託管相關的信任和資料完整性方面的關鍵挑戰。所提出的方法建立在 MPC 和 FHE 技術的基礎上,以確保中介機構和計算節點都不需要信任,從而消除了資料丟失或洩露的風險。因此,我們透過包含 FHE 和引入無需信任的中介機構,在多個方向上顯著擴展了我們之前在 Siska 等人 [44] 中的工作。
為了全面解決這個問題,我們評估了一組具有代表性的用例,以確定全面的挑戰範圍。此外,我們提出了一種用於整合的完整方法,以及解決已識別挑戰的具體方法和技術,並確定了需要進一步研究的差距。
1.2 文章大綱
本文的結構如下。第 2 節簡要回顧了資料空間、MPC 和 FHE 的概念。在第 3 節中,我們介紹了三個用例,並從部署的角度對其進行了討論,提取了它們的主要特徵和挑戰。在第 4 節中,我們提出了一種將 MPC 和 FHE 無處不在且全面地整合到資料空間中的初步方法。在此基礎上,第 5 節討論了已識別挑戰的潛在技術解決方案和研究差距。最後,我們在第 6 節中得出結論。
深入探究
如何在保護隱私的前提下,設計更有效的資料使用策略,以促進資料的共享和利用?
設計有效的資料使用策略,以在保護隱私的前提下促進資料共享和利用,需要多方面的考量和技術手段。以下是一些關鍵策略:
1. 細粒度資料訪問控制:
目的限制: 資料使用策略應明確規定資料的使用目的,並限制資料僅能用於這些目的。例如,醫療資料只能用於醫學研究,而不能用於商業營銷。
資料最小化: 僅共享滿足特定使用目的所需的最小資料集,避免過度收集和使用資料。
動態授權: 根據資料使用目的、資料敏感度和使用者身份等因素,動態調整資料訪問權限。
2. 隱私增強技術 (PETs):
安全多方計算 (MPC): 允許多方在不洩露各自資料的情況下,共同計算資料。例如,多家醫院可以利用 MPC 聯合訓練機器學習模型,而無需共享患者資料。
全同態加密 (FHE): 允許在加密資料上進行計算,而無需解密。例如,資料擁有者可以將加密資料發送到雲端進行分析,而雲端服務器無法獲取原始資料。
差分隱私: 在資料集中添加噪聲,以保護個體隱私,同時保留資料的統計特性。
3. 透明度和可審計性:
資料使用記錄: 記錄所有資料訪問和使用行為,以便審計和追蹤。
可驗證計算: 使用零知識證明等技術,證明計算結果的正確性,而無需洩露原始資料。
使用者控制和知情權: 讓資料擁有者了解其資料如何被使用,並提供選擇退出的機制。
4. 標準化和互操作性:
資料使用策略語言: 使用標準化的語言描述資料使用策略,以便機器理解和執行。
資料空間互操作性: 確保不同資料空間之間的互操作性,促進跨領域資料共享。
5. 持續監管和改進:
定期審查和更新: 定期審查和更新資料使用策略,以適應不斷變化的隱私需求和技術發展。
隱私影響評估: 在部署新的資料共享方案之前,進行隱私影響評估,識別和減輕潛在的隱私風險。
通過結合這些策略和技術,可以設計出更有效的資料使用策略,在保護隱私的同時,促進資料的共享和利用,釋放資料的價值。
如果資料中介機構本身被入侵,如何確保資料的安全性?
即使資料中介機構本身被入侵,仍然可以通過以下幾種方法確保資料的安全性:
1. 零信任資料中介:
資料加密儲存: 資料中介機構僅儲存加密資料,即使被入侵,攻擊者也無法獲取明文資料。
安全計算: 使用 MPC 或 FHE 等技術,在不解密資料的情況下進行資料處理和分析。
分散式架構: 避免單點故障,將資料和計算分散到多個節點,即使部分節點被入侵,也不會影響整體安全性。
2. 增強身份驗證和授權:
多因素身份驗證 (MFA): 要求使用者提供多種身份驗證因素,例如密碼、生物識別或硬體令牌,以提高帳戶安全性。
基於角色的訪問控制 (RBAC): 根據使用者角色和職責,限制對資料和系統資源的訪問權限。
零信任網路訪問: 默認不信任任何使用者或設備,即使它們位於內部網路,也需要進行身份驗證和授權。
3. 資料完整性和不可篡改性:
區塊鏈技術: 使用區塊鏈技術記錄資料操作歷史,確保資料的不可篡改性和可審計性。
數位簽章: 使用數位簽章驗證資料的來源和完整性,防止資料被篡改。
資料冗餘備份: 將資料備份到多個安全的位置,即使部分備份被破壞,也能夠恢復資料。
4. 入侵檢測和響應:
入侵檢測系統 (IDS): 監控網路和系統活動,檢測可疑行為並發出警報。
安全資訊和事件管理 (SIEM): 收集和分析來自多個安全設備的日誌,以便及時發現和響應安全事件。
事件響應計劃: 制定事件響應計劃,明確在資料洩露或其他安全事件發生時應採取的步驟。
5. 持續安全評估和改進:
滲透測試: 定期進行滲透測試,模擬攻擊者行為,識別系統漏洞並進行修復。
安全審計: 定期進行安全審計,評估安全控制措施的有效性,並提出改進建議。
安全意識培訓: 對員工進行安全意識培訓,提高他們對資料安全重要性的認識,並教授他們如何識別和防範安全威脅。
通過實施這些安全措施,即使資料中介機構本身被入侵,也能夠最大程度地保護資料的安全性,降低資料洩露和濫用的風險。
區塊鏈技術的發展將如何影響資料空間中安全計算的應用?
區塊鏈技術的發展將為資料空間中安全計算的應用帶來以下幾個方面的影響:
1. 增強信任和透明度:
去中心化信任: 區塊鏈的去中心化特性可以取代對中心化機構的信任,讓資料空間中的參與者更容易建立信任關係。
資料溯源和可審計性: 區塊鏈上的資料操作記錄不可篡改,可以追溯資料的來源和使用歷史,提高資料的透明度和可審計性。
智慧合約自動執行: 智慧合約可以自動執行預先定義的規則,例如資料使用協議或付款條款,減少對人工干預的需求,提高效率和安全性。
2. 促進資料共享和交易:
資料權利管理: 區塊鏈可以記錄資料的所有權和使用權限,方便資料擁有者更好地管理和控制資料的使用。
資料交易市場: 區塊鏈可以為資料交易提供安全可靠的平台,讓資料擁有者可以放心地將資料出售或出租給需要的人。
資料代幣化: 資料可以被代幣化,並在區塊鏈上進行交易,提高資料的流動性和價值。
3. 提升安全計算的效率和安全性:
安全計算基礎設施: 區塊鏈可以作為安全多方計算 (MPC) 或全同態加密 (FHE) 的基礎設施,提供安全可靠的計算環境。
分散式身份驗證: 區塊鏈可以提供去中心化的身份驗證機制,確保參與安全計算的各方的身份和權限。
隱私保護: 區塊鏈與零知識證明等技術結合,可以在保護隱私的同時,驗證計算結果的正確性。
4. 推動新的應用場景:
供應鏈金融: 區塊鏈和安全計算可以結合,在保護商業機密的同時,實現供應鏈上的資料共享和融資。
醫療資料共享: 區塊鏈可以促進醫療機構之間安全地共享患者資料,加速醫學研究和疾病診斷。
智慧城市: 區塊鏈可以支持智慧城市中各個部門之間安全地共享資料,提高城市管理效率和公共服務水平。
總之,區塊鏈技術的發展將為資料空間中的安全計算應用帶來新的機遇和挑戰。通過將區塊鏈與安全多方計算、全同態加密等技術結合,可以構建更加安全、透明和高效的資料共享和利用機制,推動資料經濟的發展。