一般

問:什麼是 AWS DataSync?

答:AWS DataSync 是受管的線上資料傳輸服務,讓透過網路或 AWS DirectConnect 在現場部署儲存系統與 Amazon S3 和 Amazon EFS 等 AWS 儲存服務之間移動並複寫大量資料的工作,變得更加簡單、自動化並快速。

問:為什麼應該使用 AWS DataSync?

答:AWS DataSync 可讓您移動、複製並同步含有數百萬個檔案的大型資料集,而無須使用開放原始碼工具建立自訂解決方案,也無須授權並管理昂貴的商業網路加速軟體。您可以使用 DataSync 一次移轉作用中的資料,為資料處理流程定期分發資料,或者持續複寫資料維持業務運行。

問:DataSync 能夠為我解決什麼問題?

答:DataSync 能降低線上資料傳輸的複雜度和成本,簡化在現場部署儲存系統與 Amazon S3 和 Amazon Elastic File System (EFS) 之間移動資料集的工作。DataSync 透過標準協定 (NFS) 連接現有的儲存系統和資料來源,並使用專門打造的網路協定和擴展架構來加快進出 AWS 的傳輸速度。DataSync 自動擴展並處理所有涉及移動資料、監控傳輸進度、加密並驗證資料傳輸,以及通知客戶發生錯誤的任務。使用 DataSync 時,您只需為所複製的資料量支付費用,沒有最低用量或預先支付費用的要求。

問:我可以從哪裡傳出和傳入資料?

答:DataSync 可以在現場部署儲存系統與 Amazon S3 和 Amazon EFS 之間複製資料。DataSync 支援 NFS 協定以存取現場部署儲存系統。

設定

問:如何開始使用 DataSync?

答:您可以在 AWS 管理主控台按幾下,或透過 AWS 命令列界面 (CLI) 來使用 DataSync 傳輸資料。請在 IT 環境中部署 DataSync 代理器、設定資料來源和目的地的位置,然後啟動複製,即可開始傳輸資料。

問:如何部署 DataSync 代理器?

答:您可以從 AWS 主控台下載 OVA,然後將 DataSync 代理器部署至現場部署的 VMware ESXi Hypervisor。代理器必須部署在您的 IT 環境中,才能存取現場部署的 NFS 伺服器。

問:DataSync 代理器有什麼資源條件?

答:您可以在此處找到每個代理程式所需的最低資源。

用量

問:如何使用 DataSync?

答:1.部署代理器 – 現場部署 DataSync 代理器,並且透過管理主控台或 API 將其連結至您的 AWS 帳戶。代理器將會存取您本地的 NFS 儲存系統,以在此讀取或寫入資料。您無須在 EC2 上部署代理器或管理任何雲端資源。

2.建立資料傳輸任務 – 指定資料來源和目的地位置,還有您想要用以設定傳輸的任何選項 (例如複製檔案中繼資料),以建立任務。

3.開始傳輸 – 在主控台中或透過 Amazon CloudWatch 開始傳輸任務並監控資料移動。

問:如何開始 DataSync 任務?

答:當您透過 AWS 管理主控台或 CLI 啟動任務時,DataSync 便會複製資料。每次執行任務時,它就會掃描來源找出變更,並且從來源位置將已變更的資料複製到目的地位置。您可以設定使用哪些來源特性來判斷資料變更,並且決定是否從目的地刪除來源位置所沒有的檔案或物件。 

問:DataSync 如何驗證資料完整性?

答:DataSync 會在傳輸過程中和結束時驗證資料完整性 (比對檢查來源和目的地檔案的總和,並且比對檔案中繼檔案)。

問:如何監控 DataSync 正在傳輸的檔案狀態?

答:您可以使用 AWS 管理主控台或 CLI 來監控正在傳輸的檔案狀態。透過 Amazon CloudWatch 指標,您可以查看已複製的檔案數目和資料量。如有發生錯誤,可以從 Amazon CloudWatch Logs 上檢視詳細的相關資訊。此外,在傳輸任務轉換狀態時所觸發的 CloudWatch Events 也能自動化相依的工作流程。您可以在 AWS 管理主控台或 CLI 中找到其他資訊,例如傳輸進度。

問:DataSync 如何存取我的現場部署檔案系統?

答:DataSync 使用您部署至 IT 環境的代理器,透過 NFS 協定來存取現場部署的檔案系統。這些代理器透過網路或您的 AWS Direct Connect 連接至 AWS,並且由 AWS 管理主控台或 CLI 安全地管理。您無須設定 VPN/通道或允許入站連線,並可設定讓代理器透過標準網路連接埠通過防火牆的路由。

問:DataSync 如何存取我的 Amazon S3 儲存貯體?

DataSync 會使用您設定的 IAM 角色存取您的 Amazon S3 儲存貯體。

問:DataSync 如何存取我的 Amazon EFS 檔案系統?

答:DataSync 會透過 NFS 協定存取 Amazon EFS 檔案系統,藉由 DataSync 所管理的彈性網路界面 (ENI),從您的 VPC 掛載您的檔案系統。DataSync 會替您全面管理這些 ENI 的建立、使用和刪除流程。

問:從 Amazon S3 輸入或輸出檔案時,DataSync 會如何對應檔案和物件?

答:當檔案複製至物件時,檔案和物件之間是一對一的關係。檔案系統中繼檔案會儲存在 S3 使用者中繼檔案裡。當含有檔案系統中繼檔案的物件複製回檔案時,中繼檔案會隨之還原。

問:DataSync 在傳輸資料時會保留什麼中繼檔案?

答:DataSync 會保留 POSIX 中繼檔案,包括使用者 ID、群組 ID 和許可,以確保檔案能夠還原至原始位置並且不會遺失此中繼檔案。此外,替 S3 內的物件從檔案儲存 POSIX 中繼檔案時,中繼檔案可與檔案閘道互相操作。

問:我是否可以與 DataSync 搭配使用版本控制、生命週期、跨區域複寫和 S3 事件通知?

答:可以。儲存貯體的版本控制、生命週期管理、跨區域複寫和 S3 事件通知政策會透過 DataSync 直接套用到傳輸至儲存貯體的物件。

請注意,如果使用版本控制,對物件中繼檔案進行變更後將會替此物件建立新版本。

您可以使用 S3 生命週期政策來變更物件的儲存層,或刪除舊的物件或物件版本。

問:資料在傳輸和儲存時,會受到加密保護嗎?

答:會。所有在來源和目的地之間傳輸的資料都會透過 Transport Layer Security (TLS) 進行加密。TLS 為取代 Secure Sockets Layer (SSL) 的新型安全憑證。資料絕不會保留在 DataSync 本身。本服務支援 S3 儲存貯體的預設加密以及 Amazon EFS 檔案系統的靜態資料加密

問:如果 DataSync 任務中斷,會發生什麼事?

答:如果某次傳輸任務中斷 (例如網路連線中斷或 DataSync 代理器重新啟動),下一次執行任務時就會傳輸先前錯過的檔案。此次任務完成後,目的地位置便會得到完整資料並與來源位置一致。每次開始任務時,DataSync 會進行遞增複製,只從來源傳輸變更過的資料至目的地。

問:我可以搭配 AWS Direct Connect 使用 DataSync 嗎?

答:可以。您可以搭配 Direct Connect 連結使用 DataSync,無須任何特別設定即可存取公共網路端點。

效能

問:DataSync 複製檔案系統至 AWS 的速度有多快?

答:DataSync 複製資料集的速度與下列因素有關:資料量、來源和目的地儲存系統能夠滿足的 I/O 頻寬、可用的網路頻寬,及網路狀態。一個 DataSync 代理器能夠佔滿 10 Gbps 的網路連結。

問:我可以控制 DataSync 任務所使用的網路頻寬量嗎?

答:可以。您可以設定內建的頻寬調節,以控制 DataSync 使用的網路頻寬量。對於使用同一網路連線的使用者或應用程式,這樣做可以有效協助降低對其造成的影響。

問:DataSync 會影響我的檔案系統效能嗎?

答:根據您現場部署檔案儲存區的容量,以及欲傳輸檔案的數量和大小而定,當其他用戶端存取同一個來源資料儲存區時,由於 DataSync 代理器也在該儲存系統讀取或寫入資料,就可能會影響其他用戶端的回應時間。您可以設定任務的頻寬限制,以限制您儲存系統的 I/O 並降低此影響。

合規

問:DataSync 支援哪些合規計劃?

答:AWS 擁有雲端最資深的合規計劃,並且致力於協助客戶釐清他們的需求。DataSync 已經通過評量,符合全球和業界的安全標準。它符合以下認證:PCI DSS、ISO 9001270012701727018,此外也符合 HIPAA 資格。這讓您能夠更輕易地驗證我們的安全性,並且滿足您自己的合規義務。如需詳細資訊,請參閱我們的合規頁面。您也可以前往合規計畫範圍內的服務頁面查看完整的服務和認證清單。

問:DataSync 是否符合 PCI 規範?

答:是。DataSync 符合 PCI-DSS 標準,因此您可以使用它來傳輸付款資訊。您可以在 AWS Artifact 下載 PCI 合規套件,進一步了解如何在 AWS 上達到 PCI 合規。

問:DataSync 是否符合 HIPAA 資格?

答:是。DataSync 符合 HIPAA 資格,因此如果您有與 AWS 簽署的 HIPAA BAA,就可以使用 DataSync 傳輸受保護的醫療資訊 (PHI)。

選擇 AWS DataSync 的時機

問:我應該選擇 AWS DataSync 還是 AWS Snowball Edge 系列?

答:AWS Snowball Edge 適合不需要立即將資料存入 AWS、頻寬有限,或者從遠端、中斷連接或嚴苛環境傳輸資料的客戶。DataSync 適合需要線上移轉作用中資料集、即時傳輸持續產生的資料,或者複寫資料以維持業務運行的客戶。

問:我應該選擇 AWS DataSync 還是 AWS Storage Gateway?

答:AWS Storage Gateway 提供混合雲儲存功能,以低延遲率的存取效能將現場部署應用程式連接至 AWS 儲存服務,並可用於備份、分層和本機存取儲存在 S3 上的物件。DataSync 可用來將資料快速地複製傳入或傳出 AWS 儲存服務。您可以使用 DataSync 快速傳輸現有資料至 Amazon S3,並且同時使用 Storage Gateway 的檔案閘道設定,以便往後從現場部署系統存取該資料時維持低延遲率。

 

問:我應該選擇 AWS DataSync 還是 S3 Transfer Acceleration?

答:如果您的應用程式已經與 Amazon S3 API 整合,而且您想要更高的輸送量來傳輸大型檔案至 S3,則可以使用 S3 Transfer Acceleration。如果您想要從現有儲存系統 (例如網路連接儲存裝置) 或無法變更的儀器 (例如基因定序工具、錄影機) 中傳出資料,或者您想要設定多個目的地,則應該使用 DataSync。

Product-Page_Standard-Icons_01_Product-Features_SqInk
進一步了解定價

AWS DataSync 的定價簡單、可預期並且根據使用率計費;您只需要為所複製的資料量付費。 

進一步了解 
Product-Page_Standard-Icons_02_Sign-Up_SqInk
註冊免費帳戶

立即存取 AWS 免費方案。 

註冊 
Product-Page_Standard-Icons_03_Start-Building_SqInk
開始移動資料至主控台

開始在 AWS 主控台中使用 AWS DataSync 進行建置。

登入