什麼是資料移轉架構?
資料移轉是將資料從一個儲存系統或運算環境移動到另一個儲存系統或運算環境的過程。任何資料移轉計劃均旨在有效地移動資料,同時妥善考慮網路資源、資料安全性、時間和傳輸方法等因素。雲端資料移轉明確著重於將資料移至雲端。
此程序不僅是重新放置資料,還涉及在不同的儲存環境之間準確地映射資料。它可以採用多種形式。例如,您可能需要定期批次上傳資料檔案,從感應器串流資料,或者從內部部署資料儲存系統實作現有封存的一次性移轉。
目標
每個雲端資料移轉專案都需要明確的業務案例來確定最佳結果。但是,大多數資料移轉有一些共同的目標:
- 提高效率,例如尋求增加正常運行時間,提高遠端優先基礎設施或系統整合方面的效率。
- 降低硬體維護、伺服器機房營運以及全天候現場系統管理員的資源開支。
- 用於進行分析、人工智慧和建置企業應用程式的基礎資料平台。
其他目標可能包括確保系統在其自然生命週期結束時保持可用性,虛擬化所有基礎設施,以及與現有雲端系統進行資料整合。
挑戰
成功的雲端移轉不僅是傳輸檔案。它要求:
- 許可、存取控制和其他中繼資料保持不變。
- 使用者在上傳期間可以不間斷地存取關鍵資料。
- 即使網路中斷仍可保持資料一致性
傳輸大量資料非常耗時,並且通常需要大量的人工干預。在轉換完成後,專用移轉工具的投資可能會導致產生沉沒成本。
因此,雲端移轉需要規劃、排程和正確的工具來限制營運開銷並降低成本。否則,資料移轉程序可能會延遲,甚至需要從頭重新啟動。
有哪些重要的資料移轉規劃考量?
參與資料移轉的領導層和團隊必須考慮下列事項:
- 移轉資料所需的時間
- 任何現有的來源與目的地不相容
- 移轉期間的安全性考量
- 移轉工具或程序的成本
- 排程考量
- 移轉類型 — 批次、串流、一次性
- 對網路資源的影響。
規劃步驟包括:
評估您的資料來源
移動資料之前,您必須評估目前的資料組態。目前的資料、儲存和存取方法類型指引您的移轉選項。
例如,儲存在現場 MySQL 伺服器上的關聯式資料庫可以藉助相對簡單的程序和一對一資料庫管理系統移轉至 Amazon Relational Database Service (RDS)。然而,適用於 ERP 的內部部署舊式系統可能會更加困難,尤其是如果數位轉型必須涉及軟體變更時。
識別並記下所有雲端移轉資料來源的詳細資訊,例如:
- 資料庫
- 應用程式資料
- 儲存
- 資料模型
- 雲端對雲端
設計您的移轉
這涉及組織和設定符合現有安全性標準的移轉工具。還必須確定資料移轉操作的順序並提前進行排程。例如,您可以選擇:
- 即時複寫以進行自動非同步物件複製,直到兩個系統之間的資料同步。
- 快照移轉以一次性傳遞完整系統狀態,然後藉助較少量的傳輸進行更新以追蹤並與目前狀態保持一致。
- 分階段移轉,以一次性移轉較小的資料集。
另外,計劃最終如何評估移轉準確性和品質。
關鍵利害關係人簡介
移轉可能會對企業員工、客戶和合作夥伴造成干擾。確保關鍵利害關係人了解移轉期間內的資料移轉程序、計劃、時間表和可存取性中斷。也可能需要開展培訓,以確保管理員知道如何設定以及使用者知道如何在移轉後存取資料和雲端服務。
在整個移轉過程中規劃並排程頻繁更新,讓相關人員保持積極的情緒。
建置和測試解決方案
每個資料移轉都需要不同的策略。某些類型的資料移轉需要快速、一次性地傳輸少量資料,而有些類型的資料移轉可能會隨著時間推移逐漸傳輸大量資料。建置和測試移轉的方式取決於所涉及的策略和工具。通常,您將保持使用舊系統,直到完成新系統的完整測試,以確保移轉程序順利完成並正確無誤。
資料移轉有哪些策略?
使用 AWS 雲端資料移轉服務將資料上傳到 AWS 雲端有著不同的策略和方法。
直接網路連線
直接網路連線是您的路由器與雲端式路由器之間的私有電纜連線。雲端式路由器位於雲端供應商的私有網路邊緣,可讓您直接使用他們的一系列服務。
AWS Direct Connect 可讓您使用乙太網路光纖電纜在您的組織和 AWS 之間建立第 3 層網路連線,以安全地將資料從您的網路移動到 AWS 服務。AWS Direct Connect 在全球各地設點,您可以在其中設定裝置進行資料移轉。
開始步驟:
步驟 1 — 選擇您的 Direct Connect 位置
選擇 AWS Direct Connect 位置,確定所需的連線,然後選取連接埠大小。可使用多個連接埠,以提高頻寬或備援。
步驟 2 — 選擇您的連線類型
決定使用專用連線或託管連線。專用連線提供多個虛擬介面的獨佔存取權,而託管連線分享交叉連線並提供單一虛擬介面。
步驟 3 — 設定虛擬介面
透過連線設定一或多個邏輯虛擬介面 (VIF)。傳輸 VIF 會連線至 AWS Transit Gateway,公有 VIF 可透過公有 IP 存取 AWS 公有服務,而私有 VIF 則使用私有 IP 連線至 Amazon VPC。
裝置式資料傳輸
將資料移動至裝置並實際傳輸到資料中心時,大規模資料移轉可以更有效率。AWS Snowball 服務可提供安全、堅固耐用的裝置,可以使用該裝置安全地將資料上傳到雲端。相關步驟如下:
1. AWS 可應請求將 Snowball 裝置運送至您的位置。
2. 將該裝置連線至您的網路,並且使用 AWS Snowball 用戶端或 AWS OpsHub 解鎖並設定裝置。
3. 將資料複製到該裝置上 — 內建加密可確保傳輸過程中的安全性。
4. 使用預付費運送標籤將裝置運送回 AWS。
5. 送達時,AWS 會自動將資料傳輸到指定的 S3 儲存貯體,並且安全地清除 Snowball 裝置。
6. 該程序完成後,您將收到通知。
上傳感應器資料串流
從 IoT 或工業裝置和感應器網路收集的串流資料可以即時傳輸到雲端,而不是在現場進行擷取和批次處理。Amazon Data Firehose 可讓您使用資料來源設定串流、視需要轉換資料,然後將資料儲存在 AWS 上的各種目的地儲存服務中。
相關步驟如下
步驟 1 — 建立 Firehose 串流
Firehose 串流是 Amazon Data Firehose 的核心實體。您可以從 AWS 主控台建立該串流,並將其設定為直接接收資料,或從現有的 Amazon Kinesis 資料串流接收資料。
步驟 2 — 將資料傳送到 Firehose 串流
資料串流生產者將大小高達 1,000 KB 的記錄傳送到 Firehose 串流。資料生產者可以是應用程式、伺服器或其他 AWS 服務。
步驟 3 — 設定緩衝和資料處理
Amazon Data Firehose 將資料交付至目的地之前,會將傳入資料放到緩衝區。您可以設定緩衝區大小 (以 MB 為單位) 和緩衝區間隔 (以秒為單位)。
步驟 4 — 選擇目的地並了解資料流程
Amazon Data Firehose 將串流資料交付至各個目的地
- Amazon S3 資料儲存在 S3 儲存貯體中,並且可選擇性地備份轉換後的資料。
- Amazon Redshift 會先交付至 S3 儲存貯體,然後使用 COPY 命令載入 Redshift。
- Amazon OpenSearch Service,可選擇性備份至 S3。
資料庫移轉
資料庫移轉是指以資料庫形式移轉關聯式資料庫、資料倉儲、NoSQL 資料庫以及其他類型的資料存放區。移轉服務會探索資料庫類型和結構描述,並直接複製到相同的基礎設施或轉換為新的目標引擎。
AWS Database Migration Service 使用自動化資料移轉程序,探索、評估、轉換資料庫和分析工作負載並將其移轉至 AWS。該服務具有高可用性,並且停機時間最少。
如果您的資料移轉案例未在上面列出,您也可以嘗試:
- AWS Transfer Family 是安全檔案傳輸服務套件,例如 SFTP
- AWS Storage Gateway 是混合式現場和雲端儲存解決方案套件
- AWS Glue 是服務套件,用於探索、準備、移動和整合各種來源的資料
資料移轉有哪些最佳實務?
以下是雲端資料移轉的一些最佳實務。
始終備份資料
無論您計劃移動資料還是僅執行日常操作,都始終備份資料。在確定雲端組態經過徹底測試並按預期運作 (具有自己的備份) 之前,請勿刪除原始資料。
確保已映射和移轉所有相依關係
資料通常會連接到各種其他相依關係,沒有這些相依關係,資料將無法正常運作。為確保順暢轉換,請務必與原始資料一起映射和移轉所有相依關係。使用者許可和存取控制應設定為與移轉前相同的層級,並在可能的情況下重新評估以提高安全性。
仔細檢查安全和合規義務與組態
在移轉之前、期間和之後,您必須檢查安全和合規政策與程序,以確定要在移轉活動中使用的正確程序和控制。
包括停用舊設備的計劃
即使已刪除檔案和磁碟空間,舊硬體仍可能包含可復原的資料。為確保完全刪除所有資料,應保證停用舊裝置,例如透過遵循《NIST 800-88 媒體清理指南》。
AWS 如何支援您的資料移轉需求?
在 AWS,我們開發了完整的資料移轉工具和服務套件,讓資料匯入和匯出變得簡單、安全且經濟高效。在整個資料移轉程序的每個階段均提供協助。請造訪 AWS 雲端移轉以利用 AWS 進行移轉和現代化,或立即申請免費的 AWS 最佳化和授權評估。