Concepts de base
本文介紹了 GREI 數據倉儲人工智慧分類法,該分類法概述了人工智慧在數據倉儲管理中的七個主要應用領域,並強調了在數據倉儲中平衡人工智慧和人類專業知識的重要性,以確保數據的完整性、可靠性和道德標準。
Résumé
GREI 數據倉儲人工智慧分類法
本文由參與美國國家衛生研究院 (NIH) 資助的「通才倉儲生態系統倡議」(GREI) 計畫的倉儲機構人員撰寫,旨在探討人工智慧在數據倉儲管理中的作用。
分類法的需求
數據倉儲需要一個結構化的框架來制定策略、促進討論,並有效應對人工智慧整合帶來的機遇和挑戰。GREI 數據倉儲人工智慧分類法應運而生,它系統地分類了人工智慧在數據倉儲操作中可以扮演的不同角色,並為參與者提供了一個共同的語言和參考點,促進了關於人工智慧工作流程整合的有效溝通。
七大應用領域
該分類法概述了人工智慧在數據倉儲管理中的七個主要應用領域:
- 獲取: 從各種來源(包括研究人員、感測器和外部數據集)高效地收集、收集和提取數據和元數據。
- 驗證: 確保數據和元數據的質量、準確性和完整性,以保持其可靠性和可信度。
- 組織: 對數據和元數據進行分類、構建和編目,以便於檢索、分析和共享。
- 增強: 使用元數據、註釋或標準化格式豐富和擴充數據和元數據,以提高其效用和互操作性。
- 分析: 利用人工智慧驅動的分析來發現數據和元數據中的洞察力、模式和趨勢,幫助研究人員和決策者。
- 共享: 促進數據和元數據在倉儲內部和外部的發現、訪問和分發,促進協作和知識傳播。
- 支援: 為數據和元數據的使用者(包括提交數據的使用者、使用數據的使用者和倉儲工作人員)提供建議並回答問題。
平衡人工智慧與人類專業知識
雖然人工智慧可以快速、準確地處理大規模數據處理任務,但人工監督對於確保這些過程符合道德標準並滿足研究社群的細微需求仍然至關重要。在數據倉儲中,人工智慧驅動的自動化與人工干預之間的平衡必須得到精心管理。
文章建議實施分層的人工智慧自動化級別,根據任務的複雜性和錯誤的潛在影響來匹配自動化程度:
- 無自動化: 完全由人類專家處理任務,適用於高度專業化或敏感的數據。
- 100% 確定性的自動化: 人工智慧處理結果高度可預測的任務,例如將元數據格式化為標準化模式。
- 人工智慧輔助,人工審查每個變更: 人工智慧提出需要人工批准的操作,確保任何人工智慧驅動的修改都符合要求的標準。
- 人工智慧輔助,人工審查部分變更: 在不太關鍵的任務中,人工可能只審查人工智慧驅動變更的樣本,以確保質量,同時受益於自動化的效率。
- 完全自主的人工智慧: 對於常規的、低風險的任務,人工智慧獨立運作,使人類專家能夠專注於更複雜的問題。
信任與透明度
隨著人工智慧越來越融入數據倉儲工作流程,信任仍然是一個至關重要的因素。為了建立和維護信任,必須遵守監管框架,例如美國科學和技術政策辦公室 (OSTP) 制定的「聯邦科學誠信政策和實踐框架」。
文章提出了三項建議,以促進在通用資料庫中使用人工智慧時的信任和透明度:
- 制定平衡的人工智慧治理和管理政策,並考慮到可能影響人工智慧使用和潛在數據傳輸的不同學科和國際倫理/法律規範(例如,GDPR 與 HIPAA)。
- 制定與人工智慧使用相關的實務守則,並為使用者提供指引(例如,標記人工智慧生成/處理的內容,識別人工智慧的參與程度和局限性)。
- 展開工作以預測各種人工智慧應用程式如何使用(和濫用)內容,以提供充分的免責聲明(以及在需要時進行限制)。
結論
人工智慧有可能徹底改變數據倉儲管理,提高效率、數據質量和可訪問性。通過採用 GREI 數據倉儲人工智慧分類法,並採用結合人工智慧和人類專業知識的平衡方法,更廣泛的數據倉儲社群可以充分利用人工智慧的潛力,同時保持數據完整性和道德標準。