什麼是資料可攜性 (資料移植)?
資料可攜性是可隨意在兩個系統之間移動資料的能力。現代企業具有不同的資料儲存和存取要求,具體取決於使用案例、地理位置、法規和客戶期望。藉助資料可攜性,這些企業能夠根據需要在雲端服務供應商和內部部署系統之間傳輸資料,從而能夠以最佳方式滿足要求。
為什麼資料可攜性很重要?
舊式系統強制客戶採用專屬資料格式和履行授權義務,並且將其鎖定在特定系統中。移動資料、不斷上升的成本和強加的廠商鎖定帶來複雜的技術挑戰。如果沒有資料可攜性,則僅可透過儲存組織資料的平台存取該資料。此類孤立的方法可能會導致產生無法存取的資料和資料品質問題。
資料可攜性的優勢包括:
支援分析資料可存取性
資料可攜性消除資料孤島,讓資料從多個系統無縫流動到單一中央儲存庫中。透過建立單一真實資料來源,業務分析師可擁有更易於存取的系統,從中擷取他們所需的資訊。此外,分析師可以在此集中式資料集區上使用多種 BI、ML 和 AI 工具,並且利用其為其他部門提供即時洞察和決策功能。
支援《加州消費者隱私保護法》和 GDPR 的法律合規
一般資料保護規範 (GDPR) 第 20 條規定,每個人都擁有資料可攜性權利。此外,《加州消費者隱私保護法 (CCPA)》要求組織實作可在不同位置之間移植資料的系統,從而移除不必要的資料孤島並促進資料民主化。
這些資料保護法律確保資料控制者實作資料可攜性,讓資料主體和所有相關方可控制其資訊。
加強資料品質管理
資料可攜性涉及建立一個系統,其中所有資料均可在您的企業中自由移動,最終得到單一真實資料來源。透過以這種方式整理資料,組織可以實作資料品質管理檢查,以篩選資料驗證、重複資料刪除和中繼資料標記。這些實務會移除任何重複、無效或淘汰的資料,以確保僅將高品質、完整的資料傳遞到您的集中式資料儲存系統。
如何實作資料可攜性?
企業採用多種策略來實作資料可攜性。
開放資料格式
幾種非專屬的資料格式可促進資料可攜性,例如 JavaScript 物件標記法 (JSON)、可擴展標記語言 (XML)、Parquet 和逗號分隔值 (CSV)。其中每種格式都得到資料倉儲和商業智慧平台的廣泛支援,從而使資料可攜性易於整合,並且有利於分析師與資料集互動。始終以這些開放資料格式提供個人資料並傳輸個人資料,以此回應資料可攜性請求。
客戶選擇
企業可以利用為客戶提供完全資料控制權的架構,在其系統中實作資料可攜性。以下是企業應遵循的一些基礎架構:
- 客戶擁有自己的資料,包括來自 IoT 裝置的所有資訊、位置資料、來自穿戴式裝置的資料以及與企業互動產生的資料。
- 客戶能夠以自己選擇的格式儲存內容。
- 客戶選擇儲存其資料的地理位置,除非客戶請求將個人資料傳輸到其他位置,否則該地理位置不會變更。
- 客戶可以隨時下載或刪除其資料。
為客戶提供完全資料控制權,這就確保他們可以輕鬆切換供應商並重新放置資料。
互通性
使用可互通的格式,資料可在不同的系統和網路之間輕鬆移動而無需修改,從而增強資料可攜性。可互通的系統應利用標準化的應用程式程式介面 (API) 和連線,以促進無縫的資料移動。
此外,實作標準資料傳輸通訊協定,例如伺服器訊息區塊 (SMB)、網路檔案系統 (NFS)、超文字安全傳輸通訊協定 (HTTPS) 和 SSH 檔案傳輸通訊協定 (SFTP),都可促進資料的無縫移動。
有哪些維持資料可攜性的最佳實務?
企業可以使用許多策略來維持資料可攜性並確保資料可攜性請求得到滿足。
了解您的資料
深入了解企業所使用的資料類型和格式、資料來源和資料儲存位置,以及在企業中處理資料的方式,從而促進使用正確的傳輸系統。透過全面掌握系統中的所有資料,您將更加準備充分地實作資料可攜性,而且其仍然保持全面的覆蓋範圍。
實作自動化
透過自動化企業使用的資料傳輸方法,可強制開發人員採用標準化的資料格式和通訊協定,從而促進不同系統的這些自動程序。自動化系統意味著:
- 減少資料可攜性方面的工作量
- 增強資料一致性
- 改善跨系統的資料移轉
- 改進資料傳輸系統。
集中化資料治理
資料治理架構決定組織如何管理和使用其儲存的資料。透過集中化資料治理並建立可依賴的全公司範圍系統,您可以標準化圍繞保留、刪除、稽核和存取管理的資料政策。有效的資料治理可實現有效的資料可攜性,確保您的資料保持可追蹤性、流動性和合規性。
確保資料品質管理
調查任何資料品質問題以找出其根本原因。您的資料驗證或轉換程序可能會出現錯誤,從而導致資料管理系統中的更嚴重問題。透過解決這些資料品質管理問題,您可以維持資料完整性,並確保整個資料系統毫無問題地順暢流動。
AWS 如何支援您的資料可攜性要求?
為客戶提供各種選擇和自由度是 AWS 全員遵守的核心原則。我們的客戶始終保留其資料的擁有權和控制權,包括儲存位置、儲存方式以及擁有存取權的人員。AWS 提供各種資料庫類型,每種類型適用於不同類型的資料。客戶沒有合約義務來僅使用單一類型的資料庫。您可以:
- 在 AWS 上執行來自其他供應商的資料庫
- 隨時變更資料庫在其上執行的執行個體類型
- 將您的資料匯出至 AWS 外部
AWS 完成的所有工作都讓客戶可以自由選擇最適合的雲端服務和可用功能。
AWS 提供許多工具和記錄技術,以支援資料移轉進入和傳出 AWS。我們的服務以許多開放標準為基礎建置,例如 SQL、Linux 和 Xen。例如,您可以使用以下服務:
- AWS Direct Connect 可透過直接連到 AWS 區域中虛擬私有雲端 (VPC) 的網路連結,和您的資料中心建立起私有連線
- AWS DataSync 可將檔案系統的資料複製或複寫到 Amazon S3 或 Amazon EFS 中
- AWS Storage Gateway – File Gateway 可將現有的內部部署應用程式連線至雲端儲存,以便將檔案作為物件儲存在 Amazon S3 中
- AWS Storage Gateway – Tape Gateway 可將現有的內部部署應用程式連線至雲端儲存以進行磁帶備份
- AWS Storage Gateway – Volume Gateway 可將現有的內部部署應用程式連線至區塊磁碟區的雲端儲存
- AWS Database Migration Service 可將資料庫快速安全地移轉至 AWS,將停機時間縮到最短
- Amazon S3 Transfer Acceleration 可將資料讀取和寫入到地理上位於遠處的 Amazon S3
- Amazon Data Firehose 可收集和擷取多個串流資料來源。
Amazon Data Portability API 可讓使用者以機器可讀的格式從 Amazon 服務存取和匯出其個人資料。這些服務可讓開發人員建立有助於安全擷取和傳輸使用者資料的工具,同時支援透明度、使用者控制以及資料隱私權法規合規。
立即建立免費帳戶,開始在 AWS 上使用資料可攜性。