跳至主要內容

什麼是資料虛擬化?

資料虛擬化是從基礎資料儲存中抽象化資料操作的過程。現代組織在各種系統和平台上以多種格式儲存資料,從傳統資料表到即時訊息和檔案。將這些資料實際移動至單一中央系統可能並非始終切實可行或不具備成本效益。

資料虛擬化使用中繼資料 (資料相關的資料) 來建立用於資料操作的虛擬層。最終使用者可以在虛擬層內以整合的方式讀取和修改資料,而無需了解基礎技術細節。虛擬層 (而非最終使用者) 與基礎儲存層進行互動,以根據需要推送或擷取資料。 

為什麼資料虛擬化很重要?

如今的組織通常在內部部署系統、雲端服務和其他孤立系統中的不同資料來源之間分散資料。由於面臨下列挑戰,實體資料合併功能受到限制:

  • 在多個平台之間手動管理來源資料可能非常耗時且容易出現錯誤。
  • 由於採用強制資料治理,多個獨立來源的存取控制可能會非常複雜。
  • 新增來源或使用者時,維持資料來源之間的直接連線可能會具有挑戰性。

其他傳統的資料整合方法需要將資料移至資料倉儲資料湖中。這種方法確實提供集中化,但需要同步維護多個副本,這反過來會影響即時報告功能。

與這些其他方法相比,資料虛擬化系統提供幾點關鍵優勢。

抽象化

從實際來源抽象化查詢,因此您可以處理複雜的資料集,而無需使用者或開發人員了解背後的每個技術詳情。

統一治理

由於資料虛擬化使用中繼資料操作,因此您可以在虛擬化層內實作集中式治理。也可以輕鬆建置和反覆運作資料模型,這些模型可快速可用,並可以重複用於未來的專案。

即時存取

資料虛擬化可讓您即時查詢多個來源。您不需要等待排程的同步。企業使用者可以與單一應用程式互動,而不是個別連線至每個系統。

單一的事實來源

您可以消除由於與另一個系統同步延遲而導致某個系統中過時資料引起的備援和混亂。您也可以透過不將資料複製到集中式資料倉儲或資料湖來降低儲存成本。

資料虛擬化有哪些使用案例?

透過簡化即時資料存取,虛擬化可以支援多項重要功能。

分析與商業智慧

分析計劃 (例如內部報告或法律合規) 通常需要整合組織內多個來源的資料。虛擬化資料存取可讓分析師和 BI 團隊輕鬆探索資料並精簡查詢,而不會對生產資料來源造成負面影響。

雲端移轉支援

將大型系統移轉至雲端可能是緩慢且充滿錯誤的過程。資料虛擬化是用於有效規劃移轉的強大工具。您的團隊可以測試切換案例並驗證資料整合程序,而不會中斷即時系統的執行。

簡化主要系統升級

為大型專案 (例如企業資源規劃 (ERP) 系統升級) 建置測試環境可能非常耗時,並且需要多個團隊之間進行廣泛的協調。使用資料虛擬化技術,團隊可以快速產生複雜的資料結構,從而提高工作效率。這可以幫助降低基礎設施成本並縮短部署時間。

生產系統支援

排查生產系統中的複雜問題有時需要重新建立完整的資料服務以進行測試。資料虛擬化技術可讓您的 IT 團隊快速建置和測試環境,而無需複製資料。這可讓這些團隊驗證修正結果並識別意外的副作用。

DevOps 工作流程

開發人員和測試人員在準備發佈應用程式時可以使用完整的虛擬資料環境。他們可以建模軟體在現實世界中的運作方式,而無需複寫大型資料集。

資料虛擬化層有哪些功能?

資料虛擬化軟體可提供簡化資料管理的多項關鍵功能。

語義建模

有意義的業務概念,例如「客戶」或「產品線」,可以使用在多個系統中分散的虛擬資料表示。虛擬化層可讓您使用資料更輕鬆地跨多個來源定義有意義的概念。

通用連線能力

透過虛擬化層存取組織內的資料來源,從而您可以更輕鬆地打破資料孤島,並且為每個團隊提供統一資料集的即時存取權。

高效能查詢

資料虛擬化軟體可利用智慧效能技術,將複雜查詢最佳化為單一、高效的陳述式。它不會對不同的系統進行備援查詢。

資料型錄

虛擬化可讓您在同一系統內儲存中繼資料或資料相關資訊。您可以使用資料來追蹤現有資料集的相關資訊,並且建置支援資料探索性的資料型錄。

資料虛擬化如何運作?

資料虛擬化是一種資料整合類型。資料虛擬化服務不是直接處理資料,而是僅對中繼資料進行操作,例如有關資料儲存位置、分類方式以及如何連線其他資料的資訊。

使用者查詢

假設您的企業有一個客戶關係管理 (CRM) 資料庫和一個用於管理產品的獨立庫存系統。但是,您想要查找在過去兩個月中名為「Smith」的客戶下的所有訂單,這是跨越兩個系統的請求。您將查詢輸入到資料虛擬化服務中。

資料整合

虛擬化服務會將該查詢分解為較小的元件。該服務使用其中繼資料識別各個來源內每個查詢元件的資料位置。它會產生子查詢,從您的 CRM 中擷取客戶資訊,以及從庫存中擷取訂單資訊。

資料呈現

當來源傳回資料時,資料虛擬化服務會在工作記憶體中對其進行轉換,並且根據需要調整格式和命名。它會篩選中繼資料識別的備援。然後,一旦轉換完成,該服務就會將整合的結果交付給您的應用程式。

雲端中採用哪些資料虛擬化方法?

您可以採用三種廣泛的方法來實作雲端資料虛擬化:自訂建置解決方案、商業工具或雲端原生解決方案。

自訂建置資料虛擬化

您的第一個選擇是使用雲端基礎設施自訂建置自己的資料虛擬化解決方案。雖然該方法可以提供針對設計和功能的更多控制,但它也需要大量的開發和維護工作。

商業資料虛擬化工具

另一個選項是使用來自廠商的預先建置資料虛擬化平台。這些工具通常提供指向許多資料來源的預先建置連接器和效能最佳化。它們也可能支援與現有公司中繼資料標準的整合。

雲端原生資料虛擬化

此方法利用雲端廠商 (例如 Amazon Web Services (AWS)) 提供的受管服務,以此簡化部署和持續營運。它可讓已經在雲端中工作或正在過渡到雲端的組織採用資料虛擬化,而不需要具備廣泛的技術專業知識。

AWS 如何支援您的資料虛擬化要求?

AWS 提供的原生功能與商業資料虛擬化服務所提供的許多功能保持一致。這些原生功能可能支援各種資料虛擬化使用案例。

Amazon Redshift 支援大規模的現代資料分析。無論您不斷增長的資料是儲存在營運資料存放區、資料湖、串流服務還是第三方資料集中,Amazon Redshift 都能協助您以最少的移動或複製作業安全存取、合併和分享資料。

Amazon Athena 是一項互動式分析服務,可直接處理儲存在 Amazon S3 中的資料。由於其是無伺服器的服務,因此您無需設定或管理任何基礎設施,即可立刻開始分析資料。

AWS Glue 是一項無伺服器資料整合服務,可簡化探索、準備和組合資料的程序。Amazon Athena 和 Amazon Redshift 已與 AWS Glue Data Catalog 原生整合,後者是支援虛擬化的中央中繼資料儲存庫。

AWS Lake Formation 可讓您更輕鬆地集中治理、保護和全域分享資料,將其用於分析和機器學習 (ML)。您可以使用 AWS Glue Data Catalog 集中管理資料安全和治理,從而使用熟悉的資料庫式功能在一個位置管理中繼資料和資料許可。它還提供精細的資料存取控制。

立即建立免費帳戶,開始在 AWS 上進行資料虛擬化。