一般

問:什麼是 AWS DataSync?

答:AWS DataSync 是一項線上資料傳輸服務,讓內部部署儲存系統與 AWS 儲存服務之間,以及各項 AWS 儲存服務之間複製大量資料的工作變得更加簡單、自動化且快速。DataSync 可在網路檔案系統 (NFS) 或伺服器訊息區塊 (SMB) 檔案伺服器、自我管理物件儲存、AWS Snowcone、Amazon Simple Storage Service (Amazon S3) 儲存貯體、Amazon Elastic File System (Amazon EFS) 檔案系統和 Amazon FSx for Windows File Server 檔案系統之間複製資料。

問:為什麼應該使用 AWS DataSync?

答:AWS DataSync 可讓您複製含有數十億個檔案的大型資料集,而無須使用開放原始碼工具建立自訂解決方案,也無須授權並管理昂貴的商業網路加速軟體。您可以使用 DataSync 將作用中資料遷移至 AWS,封存資料以釋放內部部署儲存容量,將資料複寫至 AWS 以備業務續航力之需,或者將資料傳輸至雲端進行分析和處理。

問:AWS DataSync 能夠為我解決什麼問題?

答:AWS DataSync 能降低線上資料傳輸的複雜度和成本,簡化在內部部署儲存系統與 AWS 儲存服務之間,以及各項 AWS 儲存服務之間進行資料集的傳輸。DataSync 透過標準儲存通訊協定 (NFS、SMB) 或使用 Amazon S3 API 連線至現有儲存系統和資料來源。它使用專用的網路通訊協定和擴展架構,以加速儲存系統和 AWS 服務之間的資料傳輸。DataSync 自動擴展並處理移動資料和物件、排程資料傳輸、監控傳輸進度、加密並驗證資料傳輸,以及通知客戶發生問題的任務。使用 DataSync 時,您只需為所複製的資料量支付費用,沒有最低用量或預先支付費用的要求。

問:我可以從哪裡傳出和傳入資料?
答︰AWS DataSync 可在網路檔案系統 (NFS) 或伺服器訊息區塊 (SMB) 檔案伺服器、自我管理物件儲存、AWS Snowcone、Amazon Simple Storage Service (Amazon S3) 儲存貯體、Amazon Elastic File System (Amazon EFS) 檔案系統和 Amazon FSx for Windows File Server 檔案系統之間傳輸資料。

問:如何使用 AWS DataSync 將資料遷移至 AWS?

答︰您可以使用 AWS DataSync,將內部部署資料遷移至 Amazon S3、Amazon EFS 和 Amazon FSx for Windows File Server。設定 DataSync 初始複製您的整個資料集,並排定後續增量傳輸變更資料,直到內部部署最終轉換至 AWS。DataSync 包含加密和完整性驗證,有助於確保您的資料能安全到達、完整無缺,並可立即使用。若要儘量降低對依賴網路連線的工作負載的影響,您可以排定遷移在非高峰時段執行,或透過設定內建頻寬節流限制 DataSync 所用的網路頻寬量。 DataSync 會在具有類似中繼資料結構的儲存系統間保留中繼資料,從而讓最終使用者和應用程式平穩過渡到使用目標 AWS 儲存服務。請參閱儲存部落格「使用 AWS DataSync 遷移儲存」,進一步了解遷移最佳實務和秘訣。

問:如何使用 AWS DataSync 封存不常用的資料?

答:您可以使用 AWS DataSync 將不常用的資料從內部部署儲存系統直接移至耐用且安全的長期儲存空間,例如 Amazon S3 GlacierAmazon S3 Glacier Deep Archive。使用 DataSync 篩選功能排除複製暫存檔和資料夾、僅複製來源位置的部分檔案,或在多個目的地之間分割單一檔案系統。您可以針對需要選取最具成本效益的儲存服務:將資料傳輸至任何 S3 儲存類別,或使用 DataSync 搭配 EFS 生命週期管理,將資料存放在 Amazon EFS 不常存取儲存類別 (EFS IA) 中。使用內建任務排程功能,定期封存出於合規或稽核用途應保留的資料,例如日誌、原始片段或電子病歷。 

問:如何使用 AWS DataSync 將資料複寫至 AWS,以實現業務永續性?

問:藉由 AWS DataSync,您可以定期將檔案複寫至任何 Amazon S3 儲存類別,或將資料傳送至 Amazon EFS 或 Amazon FSx for Windows File Server 供待機檔案系統使用。使用內建任務排程功能,確保您的資料集變更會定期複製到目的地儲存。閱讀這篇 AWS 儲存部落格,進一步了解使用 AWS DataSync 保護資料

問:如何使用 AWS DataSync 針對進行中的工作流程在內部部署和 AWS 之間重複傳輸?

答:您可使用 AWS DataSync 從內部部署系統持續傳輸至 AWS 或移出 AWS 以進行處理。在需要將作用中檔案快速移至 AWS 的各行各業,DataSync 可協助您加速關鍵的混合雲端儲存工作流程。這包括生命科學中的機器學習、媒體與娛樂中的影片製作、金融服務中的大數據分析,以及石油和天然氣的地震研究。DataSync 提供及時遞送,確保相依程序未延誤。您可以指定排除篩選條件、包含篩選條件或兩者,以決定每次執行任務時傳輸的檔案、資料夾或物件。

問:是否能使用 AWS DataSync 建置資料湖?

答:是。使用 AWS DataSync,您可以自動將內部部署資料集傳輸至 Amazon S3,輕鬆建立資料湖。DataSync 使用標準儲存通訊協定 (NFS、SMB) 或 Amazon S3 API 輕鬆快速地傳輸您的整個資料集。傳輸完初始資料集之後,您可以安排將後續的新資料從內部部署傳輸至 AWS。DataSync 包含加密和完整性驗證,有助於確保您的資料能安全到達、完整無缺,並可立即使用。若要儘量降低對依賴網路連線的工作負載的影響,您可以排定在非高峰時段執行傳輸任務,或透過設定內建頻寬節流,限制 DataSync 使用的網路頻寬量。資料放入 Amazon S3 之後,您可以使用原生 AWS 服務執行大數據分析、人工智慧 (AI)、機器學習 (ML)、高效能運算 (HPC) 和媒體資料處理應用程式,從非結構化資料集獲得洞見。 閱讀 AWS 資料湖儲存體網頁,以進一步了解有關建置和利用資料湖的資訊。

問:如何使用 AWS DataSync 在 AWS 儲存服務之間傳輸資料?

答:您可以使用 DataSync,在同一 AWS 帳戶內的 Amazon S3、Amazon EFS 或 Amazon FSx for Windows File Server 之間傳輸檔案或物件。您可以在同一 AWS 區域中的 AWS 服務之間,除中國以外的不同商業 AWS 區域中的服務之間,或在 AWS GovCloud (美國東部和美國西部) 區域之間傳輸資料。這不需要部署 DataSync 代理程式,並且可使用 AWS DataSync 主控台、AWS 命令列界面 (CLI) 或 AWS 軟體開發套件 (SDK) 進行端對端設定。

問︰是否能使用 AWS DataSync 遷移至 Amazon WorkDocs?

答:是。AWS DataSync 透過自動將檔案上傳至用於遷移的 Amazon S3 儲存貯體,來加速 Amazon WorkDocs 遷移服務的必要步驟。DataSync 讓主目錄和部門共享資源遷移到 WorkDocs 變得更加容易和快捷。 要進一步了解使用 DataSync 遷移到 WorkDocs,請參閱 'Migrating network file shares to Amazon WorkDocs using AWS DataSync' 部落格。

用量

問:如何開始使用 AWS DataSync?

答:您可以在 AWS 管理主控台按幾下,或透過 AWS 命令列界面 (CLI) 來使用 AWS DataSync 傳輸資料。若要開始,請遵循以下 3 個步驟:

1.若要在內部部署儲存系統與 AWS 儲存服務之間傳輸資料,請部署代理程式 - 部署 DataSync 代理程式,並透過管理主控台或 API 將其關聯至您的 AWS 帳戶。代理程式會用來存取 NFS 伺服器、SMB 檔案共享或自我管理物件儲存體,以從中讀寫資料或向其寫入資料。 無需部署代理程式,即可在同一 AWS 帳戶內的 AWS 儲存服務之間傳輸資料。

2.建立資料傳輸任務 – 指定資料來源和目的地位置,還有您想要用以設定傳輸的任何選項 (例如所需的任務排程),以建立任務。

3.開始傳輸 – 在主控台中或透過 Amazon CloudWatch 開始傳輸任務並監控資料移動。

問:如何部署 AWS DataSync 代理程式?

答:您可以將 AWS DataSync 代理程式部署至內部部署虛擬化管理程序或 Amazon EC2。若要將資料複製到內部部署檔案伺服器或從內部部署檔案伺服器複製資料,請從 AWS 主控台下載代理程式虛擬機器映像並部署至內部部署 VMware ESXi、Kernel-based Virtual Machine (KVM) 或 Microsoft Hyper-V 虛擬化管理程序。使用 DataSync 代理程式時,必須部署代理程式,以便其可使用 NFS、SMB 通訊協定或 Amazon S3 API 存取檔案伺服器。 若要在 AWS Outposts 儲存貯體上的 S3 與 AWS 區域中的 S3 儲存貯體之間設定傳輸,請在 Outpost 上部署代理程式。要設定 AWS Snowcone 裝置和 AWS 儲存之間的傳輸,請使用裝置中預先安裝的 DataSync 代理程式 AMI

無需部署代理程式,即可在同一 AWS 帳戶內的 AWS 儲存服務之間傳輸資料。若要在自我管理雲端檔案伺服器中,或在不同 AWS 帳戶的 AWS 儲存服務之間來回複製資料,您可以使用 DataSync 代理程式 AMI 來啟動 Amazon EC2 執行個體。

問:AWS DataSync 代理程式有什麼資源要求?

答:您可以在這裡找到執行代理程式的最低資源要求。

問:如何啟動 AWS DataSync 資料傳輸任務?

答:當您透過 AWS 管理主控台AWS 命令列界面 (CLI) 起始任務時,AWS DataSync 會複製資料。每次執行任務時,它會掃描來源和目的地找出變更,並且從來源位置將已變更的任何資料和中繼資料複製到目的地位置。您可以設定使用哪些來源特性判斷資料變更、定義篩選條件以納入和排除特定檔案或資料夾,以及控制是否應在來源變更時覆寫目的地中的檔案或物件,或是在來源中沒有時將其刪除。

問:AWS DataSync 如何確保正解複製我的資料?

答:AWS DataSync 在傳輸和存放資料時,會執行完整性檢查,以確保寫入目的地的資料與從來源讀取的資料相符。此外,可以執行選用的驗證檢查,在傳輸結束時比較來源和目的地。 DataSync 將計算並比較來源和目的地中所儲存資料的完整檔案檢查總和。您可以檢查整個資料集,或者僅檢查 DataSync 傳輸的檔案或物件。

問:如何監控 AWS DataSync 傳輸的資料狀態?

答:您可以使用 AWS 管理主控台或 CLI 監控傳輸的資料狀態。您可以透過 Amazon CloudWatch 指標查看已複製的檔案數目和資料量。 您也可以啟用將個別檔案記錄到 CloudWatch Logs,以便找出在指定時間傳輸的內容,以及 DataSync 執行內容完整性驗證的結果。這可簡化監控、報告和疑難排解,並且讓您能夠及時向利益相關者提供更新。您可以在 AWS 管理主控台或 CLI 中找到其他資訊,例如傳輸進度。

問:我可以篩選 AWS DataSync 傳輸的檔案和資料夾?

答:是。您可以指定排除篩選條件、包含篩選條件或兩者,以限制每次執行任務時傳輸的檔案、資料夾或物件。建立任務時,可以設定複製時一律排除的檔案路徑或物件金鑰。然後,當您開始任務時,設定該任務執行時一律要包含的檔案路徑或物件金鑰。如果未設定篩選條件,則每次執行任務時,會將所有變更的資料從來源傳輸到目的地。閱讀此 AWS 儲存部落格,進一步了解搭配一般篩選條件使用 DataSync

問:我可以設定 AWS DataSync 按排程傳輸嗎?

答:是。您可以使用 AWS DataSync Console 或 AWS Command Line Interface (CLI) 排定您的任務,而無需寫入和執行指令碼來管理重複的傳輸。任務排程會以主控台中直接提供的每小時、每日或每週選項,自動按您設定的排程執行任務。這可讓您確保自動偵測對資料集所做的變更,並複製到您的目的地儲存。

問:AWS DataSync 在複製檔案時是否會保留目錄結構?

答:是。傳輸檔案時,AWS DataSync 會在目的地建立一個與來源位置結構相同的目錄結構。

問:如果 AWS DataSync 任務中斷,會發生什麼事?

答:如果任務中斷 (例如,網路連線中斷或 AWS DataSync 代理程式重新啟動),下次執行任務時會傳輸先前錯過的檔案,此次任務完成後的資料便會完整且一致。每次開始任務時,它會進行遞增複製,只從來源傳輸變更過的資料至目的地。

問:我是否可以 AWS DataSync 與 AWS Direct Connect 搭配使用?

答:是。您可以將 AWS DataSync 與 Direct Connect 連結搭配使用,以存取公有服務端點或私有 VPC 端點。使用 VPC 端點時,在 DataSync 代理程式與 AWS 服務之間傳輸的資料不需要周遊公有網際網路或需要公有 IP 地址,由於它是透過網路複製,因此能提高安全性。

問:AWS DataSync 是否支援 VPC 端點或 AWS PrivateLink?

答:是。您可以使用 VPC 端點來確保在 AWS DataSync 代理程式 (內部部署或部署在雲端中) 之間傳輸的資料不需要周遊公有網際網路或需要公有 IP 地址。使用 VPC 端點可提高資料的安全性,方式是保持 Amazon Virtual Private Cloud (Amazon VPC) 內的網路流量。 DataSync 的 VPC 端點採用 AWS PrivateLink 技術,這是高度可用且可擴展的技術,能夠讓您透過私有連線將 VPC 連接到支援的 AWS 服務。

問:如何將 AWS DataSync 設定為使用 VPC 端點?

答:若要將 VPC 端點與 AWS DataSync 搭配使用,請在所選的 VPC 中為 DataSync 服務建立 AWS PrivateLink 界面 VPC 端點,然後在建立 DataSync 代理程式時選擇此端點彈性網路界面 (ENI)。您的代理程式將連接到此 ENI 進行啟用,而之後由這個代理程式傳輸的所有資料都不會離開您設定的 VPC。您可以使用 AWS DataSync 主控台、AWS 命令列界面 (CLI) 或 AWS SDK 來設定 VPC 端點。若要進一步了解,請參閱 Using AWS DataSync in a Virtual Private Cloud

傳輸至和從 Amazon S3 傳輸

問:我可以將資料複製到 Amazon S3 Glacier、Amazon S3 Glacier Deep Archive 或其他 S3 儲存類別中嗎?

答:是。設定與 AWS DataSync 一起使用的 S3 儲存貯體時,可以選擇 DataSync 用於儲存物件的 S3 儲存類別。DataSync 支援將資料直接儲存為以下類別︰S3 標準、S3 智慧型分層、S3 標準 – 不常存取 (S3 標準 – IA)、S3 單區域 – 不常存取 (S3 單區域 – IA)、Amazon S3 Glacier (S3 Glacier) 和 Amazon S3 Glacier Deep Archive (S3 Glacier Deep Archive)。有關 Amazon S3 儲存類別的更多資訊,請參閱《Amazon Simple Storage Service 開發人員指南》

小於每個物件最小收費容量的物件將儲存在 S3 標準中。例如,大小為零位元組且僅包含中繼資料的資料夾物件將存儲在 S3 標準中。在我們的文件中閱讀有關使用 Amazon S3 存儲類別的注意事項,有關最低收費容量的更多資訊,請參閱 Amazon S3 定價

問:我可以從 S3 Standard-IA 和 S3 One Zone-IA 儲存類別複製資料嗎?

答:是。當使用 S3 作為 AWS DataSync 任務的來源位置時,該服務將從儲存貯體中擷取所有需要複製到目的地的物件。從 S3 Standard-IA 和 S3 One Zone-IA 儲存擷取物件將導致基於物件大小的擷取費用。在我們的文件中閱讀有關使用 Amazon S3 儲存類別的注意事項。

問:我可以從 S3 Glacier 和 Amazon S3 Glacier Deep Archive 複製資料嗎?

答:當使用 S3 作為 AWS DataSync 任務的來源位置時,該服務將嘗試從儲存貯體中擷取所有需要複製到目的地的物件。擷取儲存在 S3 Glacier 或 S3 Glacier Deep Archive 儲存類別中的物件會導致錯誤。擷取已存檔物件時發生的任何錯誤將由 DataSync 記錄,並會導致失敗的任務完成狀態。在我們的文件中閱讀有關使用 Amazon S3 儲存類別的注意事項。

問:AWS DataSync 如何存取我的 Amazon S3 儲存貯體?

答:AWS DataSync 擔任您提供的 IAM 角色。您附加至角色的政策決定角色可執行的操作。DataSync 可代表您自動產生此角色,也可以手動設定角色

問:AWS DataSync 如何在 Amazon S3 中將檔案和資料夾轉換為物件或從物件轉換檔案和資料夾?

答:將檔案或資料夾複製到 Amazon S3 時,檔案或資料夾與物件之間是一對一的關係。檔案和資料夾時間戳記與 POSIX 許可 (包括使用者 ID、群組 ID 和許可) 存放在 S3 使用者中繼資料中。若是 NFS 共用,存放在 S3 使用者中繼資料的檔案中繼資料可與檔案閘道完全互相操作,由 AWS DataSync 提供對存放在 Amazon S3 資料的內部部署檔案型存取權。

當 DataSync 將包含此使用者中繼資料的物件複製回 NFS 伺服器時,系統會恢復此檔案中繼資料。從 NFS 複製回 S3 時,符號連結和硬式連結也會還原。

從 SMB 檔案共享複製時,系統會將預設 POSIX 許可存放在 S3 使用者中繼資料中。複製回 SMB 檔案共享時,系統會根據 DataSync 中設定的使用者設定擁有權以存取該檔案共享,並指派預設許可。

若要進一步了解 DataSync 如何存放檔案和中繼資料,請參閱我們的文件。

問:在自我管理物件儲存體和 Amazon S3 之間傳輸物件時會保留哪些物件中繼資料?

答:在自我管理物件儲存體和 Amazon S3 之間傳輸物件時,DataSync 會將物件及物件中繼資料和標籤一起複製。

問:在 Amazon S3 儲存貯體之間傳輸物件時會保留哪些物件中繼資料?

答:在 Amazon S3 儲存貯體之間傳輸物件時,DataSync 會將物件及物件中繼資料和標籤一起複製。DataSync 不會複製其他物件資訊,例如物件 ACL 或先前的物件版本。

問:將 S3 儲存類別與 AWS DataSync 一起使用時,哪些 Amazon S3 請求和儲存成本適用?

答:某些 S3 儲存類別的行為會影響您的成本,例如資料擷取、最小儲存容量和最小儲存持續時間。DataSync 自動執行資料管理以解決這些因素,並提供盡可能減少資料擷取的設定。

若要避免每個物件最低容量收費,AWS DataSync 會自動在 S3 Standard 中儲存小物件。為儘量降低資料擷取費,您可以設定 DataSync 僅驗證指定任務傳輸的檔案。為避免最低儲存持續時間費用,DataSync 具有覆寫和刪除物件控制。在我們的文件中閱讀有關使用 Amazon S3 儲存類別的注意事項。

問:我是否可以在 AWS Outposts 的 Amazon S3 儲存貯體上來回複製物件資料?

答:可以。您可以在 AWS Outposts 的 Amazon S3 和 AWS 區域的 Amazon S3 儲存貯體之間複製物件。AWS DataSync 會複製具有物件中繼資料與物件標籤的物件。為了讓 DataSync 得以存取您在 Outposts 儲存貯體上的 Amazon S3,請在 Outposts 上部署 DataSync EC2 代理程式

每當搭配 Outposts 的 Amazon S3 使用 DataSync 時,您僅能在 AWS 區域中的 Amazon S3 儲存貯體來回傳輸資料。您可以在我們的文件中深入瞭解 DataSync 任務所支援的來源與目的地。

在 Amazon EFS 進行來回傳輸

問:AWS DataSync 如何存取我的 Amazon EFS 檔案系統?

答:AWS DataSync 使用 NFS 協定存取 Amazon EFS 檔案系統。DataSync 服務是在 DataSync 服務管理的彈性網路界面 (ENI) 中,從 VPC 掛載您的檔案系統。DataSync 會代您全面管理這些 ENI 的建立、使用和刪除。

問:是否可以將 AWS DataSync 與所有 Amazon EFS 儲存類別搭配使用?

答:是。您可以使用 AWS DataSync 將檔案複製到 Amazon EFS 並設定 EFS 生命週期管理,以將設定時段未存取的檔案遷移至「不常存取 (IA)」儲存類別。

問:是否可以使用 AWS DataSync 將 Amazon EFS 檔案系統複製到其他 AWS 區域?

答:是。您可以使用 AWS DataSync 進行排程,將您的 Amazon EFS 檔案系統定期複製到同一 AWS 帳戶中的另一個 Amazon EFS 檔案系統。此功能可用於相同區域和跨區域部署,並且不需要使用 DataSync 代理程式。

問:在 NFS 共用和 Amazon EFS 之間,或兩個 Amazon EFS 檔案系統之間複製資料時會保留哪些中繼資料?

答:AWS DataSync 複製檔案和資料夾時間戳記與 POSIX 許可,包括使用者 ID、群組 ID 和許可。您可以進一步了解,並在我們的文件中查看複製的中繼資料完整清單。

傳入和傳出 Amazon FSx for Windows File Server

問:AWS DataSync 如何存取我的 Amazon FSx 檔案系統?

答:AWS DataSync 使用 SMB 通訊協定存取您的 Amazon FSx 檔案系統,並使用您在 AWS 主控台或 CLI 中設定的使用者名稱和密碼進行身分驗證。DataSync 服務是在 DataSync 服務管理的彈性網路界面 (ENI) 中,從 VPC 掛載您的檔案系統。DataSync 會代您全面管理這些 ENI 的建立、使用和刪除。

問:在與 Amazon FSx for Windows File Server 檔案系統的 SMB 共用之間,或者兩個 Amazon FSx 檔案系統之間進行複制時,會傳輸哪些 Windows 中繼資料?

答:AWS DataSync 將複製 Windows 中繼資料,包括檔案時間戳記、檔案擁有者、標準檔案屬性和 NTFS 選擇性存取清單 (DACL)。您可以進一步了解,並在我們的文件中查看複製的中繼資料完整清單。

問:是否可以使用 AWS DataSync 將 Amazon FSx for Windows File Server 檔案系統複製到其他 AWS 區域?

答:是。您可以使用 AWS DataSync 進行排程,將您的 Amazon FSx for Windows File Server 檔案系統定期複製到同一 AWS 帳戶中的另一個檔案系統。此功能可用於相同區域和跨區域部署,並且不需要使用 DataSync 代理程式。

傳入和傳出 AWS Snowcone

問:如何在 AWS Snowcone 和 AWS 儲存服務之間傳輸資料?

答:DataSync 代理程式會以 AMI 的形式預先安裝在您的 Snowcone 裝置。要線上傳輸資料到 AWS,請將 AWS Snowcone 裝置連接到外部網路,然後使用 AWS OpsHub 或 CLI 啟動 DataSync 代理程式 AMI。使用 AWS 管理主控台或 CLI 啟用代理程式,並設定您要在 AWS Snowcone NFS 存放區和 Amazon S3、Amazon EFS 或 Amazon FSx for Windows File Server 之間進行的線上資料傳輸任務。

效能

問:AWS DataSync 將檔案系統複製到 AWS 的速度有多快?

答:AWS DataSync 複製特定資料集的速度與下列因素有關:資料量、來源和目的地儲存能夠滿足的 I/O 頻寬、可用的網路頻寬,及網路條件。為了在內部部署與 AWS 儲存服務之間進行資料傳輸,單一 DataSync 任務能夠完全利用 10 Gbps 網路連結。

問:我是否可以控制 AWS DataSync 任務所使用的網路頻寬量?

答:是。您可以設定內建的頻寬調節,以控制 AWS DataSync 使用的網路頻寬量。 您可以在資料傳輸任務執行時增加或減少此限制。對於使用同一網路連線的使用者或應用程式,這樣做讓您能夠有效協助降低對其造成的影響。

問:如何監控 AWS DataSync 的效能?

答:AWS DataSync 產生 Amazon CloudWatch 指標,以便精細查看傳輸程序。使用這些指標,您可以查看複製的檔案數和資料量,以及資料探索和驗證進度。您可以查看 CloudWatch Graphs,這些指標直接位於 DataSync 主控台。

問:AWS DataSync 是否會影響我的來源檔案系統效能?

答:根據您內部部署檔案存放區的容量,以及要傳輸的檔案數量和大小而定,當存取相同來源資料存放區時,由於代理程式從該儲存系統讀取或寫入資料,因此 AWS DataSync 可能會影響其他用戶端的回應時間。您可以設定任務的頻寬限制,透過限制儲存系統的 I/O 來減少此影響。

安全與合規

問:資料在傳輸和存放時是否會加密?

答:是。在來源和目的地之間傳輸的所有資料都會透過 Transport Layer Security (TLS),已取代 Secure Sockets Layer (SSL) 進行加密。資料絕不會保留在 AWS DataSync 本身。本服務支援使用 S3 儲存貯體的預設加密Amazon EFS 檔案系統的靜態資料加密以及 Amazon FSx For Windows File Server 靜態和傳輸中加密

問:AWS DataSync 如何存取 NFS 伺服器或 SMB 檔案共享?

答:AWS DataSync 使用您部署至 IT 環境或 Amazon EC2 的代理程式,透過 NFS 或 SMB 協定存取檔案。此代理程式會連接到 AWS 中的 DataSync 服務端點,且可以從 AWS 管理主控台或 CLI 安全地進行管理。

問:AWS DataSync 如何存取我的自我管理物件儲存體?

答:AWS DataSync 使用您部署至 IT 環境或 Amazon EC2 的代理程式,透過 Amazon S3 API 存取您的物件。此代理程式會連接到 AWS 中的 DataSync 服務端點,且可以從 AWS 管理主控台或 CLI 安全地進行管理。

問:AWS DataSync 是否需要設定 VPN 來連接至我的目的地儲存?

答:否。複製資料至或從您的內部部署複製時,無需設定 VPN/通道或允許傳入連線。AWS DataSync 代理程式可設定為使用標準網路連接埠透過防火牆路由。您還可以使用 VPC 端點在 Amazon Virtual Private Cloud (Amazon VPC) 內部署 DataSync。使用 VPC 端點時,在 DataSync 代理程式與 AWS 服務之間傳輸的資料不需要周遊公有網際網路或需要公有 IP 地址。

問:AWS DataSync 代理程式如何安全連接至 AWS?

答:AWS DataSync 代理程式會連接至您所選擇的 AWS 區域內的 DataSync 服務端點。您可以選擇讓代理程式連接至公有網際網路對應端點、美國聯邦資訊處理標準 (FIPS) 驗證的端點或您的一個 VPC 內的端點。啟用代理程式可將其安全地與您的 AWS 帳戶關聯。若要進一步了解,請參閱「選擇服務端點」啟用您的代理程式

問:我的 AWS DataSync 代理程式如何修補和更新?

答:啟動代理程式後,AWS 會自動套用對代理 VM 的更新,包括基礎作業系統和 AWS DataSync 軟體套件。當代理程式處於閑置狀態且不執行資料傳輸任務時,會不中斷地套用更新。

問:AWS DataSync 支援哪些合規計劃?

答:AWS 擁有雲端執行時間最長的合規計劃。AWS 致力於協助客戶瀏覽其需求。AWS DataSync 已經通過評估,符合全球和業界的安全標準。DataSync 符合以下認證:PCI DSS、ISO 9001270012701727018SOC 1、2 和 3,此外也符合 HIPAA 資格。 此外,DataSync 在 AWS 美國東部/西部區域獲得 FedRAMP 中等規格下核發的授權,以及在 AWS GovCloud (US) 區域獲得 FedRamp 高規格下核發的授權。這讓您能夠更輕易地驗證我們的安全性,並滿足自己的合規義務。如需詳細資訊和資源,請參閱我們的合規頁面。您也可以前往合規計畫範圍內的服務頁面查看完整的服務和認證清單。

問:AWS DataSync 是否符合 PCI 標準?

答:是。AWS DataSync 符合 PCI-DSS 標準,因此您可以使用它來傳輸付款資訊。您可以在 AWS Artifact 下載 PCI 合規套件,進一步了解如何在 AWS 上達到 PCI 合規。

問:AWS DataSync 是否符合 HIPAA 資格?

答:是。AWS DataSync 符合 HIPAA 資格,因此如果您有與 AWS 簽署的 HIPAA BAA,就可以使用 DataSync 傳輸受保護的醫療資訊 (PHI)。

問︰AWS DataSync 在 AWS 美國東部/西部區域是否具有 FedRAMP JAB 中等規格臨時操作授權?

答:是。AWS DataSync 在美國東部/西部區域已獲得聯合授權委員會 (JAB) 在聯邦風險與授權管理計劃 (FedRAMP) 中等規格基準下核發的臨時操作授權 (P-ATO)。若您是聯邦或商業客戶,則可以在 AWS 東部/西部區域的授權範圍內使用 AWS DataSync,並將資料的影響提高至中等級別。

問︰AWS DataSync 在 AWS GovCloud (US) 區域是否具有 FedRAMP JAB 高規格臨時操作授權?

答:是。AWS DataSync 在 US GovCloud 區域已獲得聯合授權委員會 (JAB) 在聯邦風險與授權管理計劃 (FedRAMP) 高規格基準下核發的臨時操作授權 (P-ATO)。若您是聯邦或商業客戶,則可以在 AWS GovCloud (US) 區域的授權範圍內使用 AWS DataSync,並將資料的影響提高至高級別。

選擇 AWS DataSync 的時機

問:AWS DataSync 與使用 rsync 或 Amazon S3 等命令列介面工具有何不同?

答:AWS DataSync 完全自動化並加速將大型作用中資料集遷移至 AWS。其原生與 Amazon S3、Amazon EFS、Amazon FSx for Windows File Server、Amazon CloudWatchAWS CloudTrail 整合,提供您儲存服務的無縫和安全存取,以及詳細監控傳輸。

DataSync 使用專用網路協定和擴展架構來傳輸資料。 為了在內部部署與 AWS 儲存服務之間進行資料傳輸,單一 DataSync 任務能夠完全利用 10 Gbps 網路連結。

具體來說,DataSync 完全自動化資料的傳輸。它有重試和網路彈性機制、網路最佳化、內建任務排程,透過 DataSync API 和主控台進行監控,另外還有 CloudWatch 指標、事件和日誌,可清楚看到傳輸過程。DataSync 在傳輸期間和傳輸結束時執行資料完整性驗證。

DataSync 提供端對端安全性,且直接與 AWS 儲存服務整合。來源和目的地之間所有傳輸的資料都會經過 TLS 加密,並透過內建的 AWS 安全機制 (如 IAM 角色) 啟用 AWS 儲存的存取。會啟用含 VPC 端點的 DataSync,確保組織與 AWS 之間傳輸的資料不需要周遊公有網際網路,由於它是透過網路複製,因此能提高資料安全性。

問:若要在儲存貯體之間傳輸物件,何時使用 AWS DataSync,何時使用 S3 複寫,以及何時使用 S3 批次操作?

答:AWS 提供多種工具在儲存貯體之間複製物件。

使用 AWS DataSync 進行持續的資料分發、資料管道和資料湖擷取,以及在多個儲存貯體之間合併或拆分資料。

使用 S3 複寫將資料持續複製到特定的目的地儲存貯體。

使用 S3 批次操作,對 S3 物件進行大規模批次操作,例如複製物件,設定物件標籤或存取控制清單 (ACL),啟動 Amazon S3 Glacier 的物件還原,叫用 AWS Lambda 函數,以使用您的物件執行自訂操作,管理 S3 物件鎖合法保留,或管理 S3 物件鎖定保留日期。

問:我何時使用 AWS DataSync,以及何時使用 AWS Snowball Edge?

答:AWS DataSync 最適合線上資料傳輸。您可以使用 DataSync 將作用中資料遷移至 AWS、將資料傳輸至雲端進行分析和處理、封存資料以釋放內部部署儲存容量,或者將資料複寫至 AWS 以備業務續航力之需。

AWS Snowball Edge 非常適合線上資料傳輸,適合頻寬有限,或者從遠端、中斷連接或嚴苛環境傳輸資料的客戶。 

問:我何時使用 AWS DataSync,以及何時使用 AWS Storage Gateway?

答:使用 AWS DataSync 將現有資料移轉至 Amazon S3,隨後使用 AWS Storage Gateway 的檔案閘道組態,保留對移轉資料的存取,以及您內部部署檔案型應用程式的持續更新。

您可以使用 DataSync 和檔案閘道的組合來儘量縮小內部部署基礎架構,同時將內部部署應用程式順暢連接至您的雲端儲存。AWS DataSync 可讓您自動化和加速線上資料傳輸至 AWS 儲存服務。 在使用 AWS DataSync 進行初始資料傳輸階段之後,檔案閘道將為您的內部部署應用程式提供已遷移資料的低延遲存取。將 DataSync 與 NFS 共用搭配使用時,將會保留來源內部部署儲存體中的 POSIX 中繼資料,並且在使用檔案閘道存取檔案時,將會套用來源儲存體中的許可。

問:我何時使用 AWS DataSync,以及何時使用 Amazon S3 Transfer Acceleration?

答:如果您的應用程式已經與 Amazon S3 API 整合,而且您想要更高的輸送量來傳輸大型檔案至 S3,則可以使用 S3 Transfer Acceleration。如果您想要從現有儲存系統 (例如網路連接儲存裝置) 或無法變更的儀器 (例如 DNA 定序工具、錄影機) 傳出資料,或者您想要設定多個目的地,則應該使用 AWS DataSync。DataSync 也提供額外功能,例如內建重試和網路彈性機制、資料完整性驗證以及彈性組態以滿足您的特定需求,包括頻寬調節,以此自動化並簡化資料傳輸。

問:我何時使用 AWS DataSync,以及何時使用 AWS Transfer Family?

答:如果目前使用 SFTP 與第三方交換資料,則 AWS Transfer Family 提供全受管的 SFTP、FTPS 和 FTP 直接傳入和傳出 Amazon S3,同時減少營運負擔。

如果您希望加速並自動化 NFS 伺服器、SMB 檔案共享、自我管理物件儲存體、AWS Snowcone、Amazon S3、Amazon EFS 和 Amazon FSx for Windows File Server 之間的資料傳輸,則可以使用 AWS DataSync。DataSync 適合需要線上遷移作用中資料集、及時傳輸持續產生的資料,或者複寫資料以維持業務續航力的客戶。 

進一步了解 DataSync 定價
進一步了解定價

AWS DataSync 的定價簡單、可預期並且根據使用率計費;您只需要為所複製的資料量付費。 

進一步了解 
註冊 AWS 帳戶
註冊免費帳戶

立即存取 AWS 免費方案。 

 

註冊 
在主控台開始使用 DataSync
在主控台開始移動資料

開始在 AWS 主控台中使用 AWS DataSync 進行建置。

登入