AWS Snowball 入門

建立免費帳戶

獲得 12 個月的 AWS 免費方案,同時享受 AWS 的基本支援功能,包括全年無休的客戶服務、支援論壇等等。

問:什麼是 AWS Snowball?

AWS Snowball 是一種資料傳輸解決方案,使用專為安全實體傳輸設計的儲存設備來加快將數 TB 甚至數 PB 的資料移入和移出 AWS 的速度。使用 Snowball 可協助克服大規模資料傳輸時會遭遇的挑戰,包括昂貴的網路費用、冗長的傳輸時間以及安全方面的考量。

問:Snowball 如何運作?

AWS Snowball 使用安全的設備和 Snowball 用戶端,來加快 PB 級資料傳入和傳出 AWS 的速度。您可以使用 AWS 管理主控台來開始建立一或多個任務,以請求一或多個 Snowball 設備 (根據所需傳輸的資料量而定),以及下載並安裝 Snowball 用戶端。設備到達後,將設備連接至本機網路,手動或使用 DHCP 設定 IP 地址,然後使用用戶端以識別您想複製的目錄。當傳輸任務完成時,用戶端會自動加密資料並將資料複製到設備,而且會通知您。當傳輸完成且準備將設備送回時,E Ink 運送標籤會自動更新以指示要寄往的正確 AWS 設施,您可以使用 Amazon Simple Notification Service (Amazon SNS)、文字訊息或直接在主控台追蹤任務狀態。

問:Snowball 適合哪些人使用?

如果您需要安全迅速地傳輸數 TB 甚至數 PB 的資料到 AWS,Snowball 是一個最合適的資料傳輸選項。如果您不想投入昂貴資金升級網路基礎設施,或者不希望經常發生資料大量積存,還是您位於實體隔離的環境、不提供高頻寬網際網路連線或限於成本的區域中,Snowball 也都會是正確的選擇。

問:我可以使用 Snowball 傳輸多少資料?

您幾乎可以透過 Snowball 傳輸任意數量的資料,從數 TB 到數 PB 皆可。您通常可傳輸數 TB 的資料至每個 Snowball 設備。您可以平行或依序使用多個 Snowball 來傳輸較大型的資料集。例如,您可以平行或依序使用 2 個 Snowball 來傳輸 100 TB 的資料。

問:什麼是 Snowball 用戶端?

Snowball 用戶端是安裝在本機主機電腦的軟體,可用於有效識別、壓縮及加密資料,並將資料從指定的目錄傳輸至 Snowball。

問:傳輸資料需要多久?

您可以使用 Snowball 用戶端預估傳輸資料所需的時間 (請參閱使用者指南進一步了解詳細資訊)。有多種因素會影響資料傳輸的速度,包含本機網路速度、檔案大小,以及從本機伺服器讀取資料的速度。

Snowball 用戶端會以條件允許的最快速度將資料複製到 Snowball (根據您的本機環境而定,複製 48 TB 的資料可能僅需一天的時間)。將資料傳入 AWS 的端對端時間大約為 1 週,其中包括 AWS 資料中心的一般運送和處理時間。您可以平行使用兩個 48 TB Snowball,在相同的時間複製兩倍的資料,或者在一個 80 TB 的 Snowball 上以兩天半時間複製 80 TB 的資料,這會將您的端對端時間增加至一週半。

問:Snowball 設備的規格為何?

包含界面、散熱和電力需求、分貝輸出及尺寸等硬體規格的完整清單,請參考此 Snowball 文件頁面

問:我可以讓 Snowball 執行特定任務多長時間?

為了安全目的,資料傳輸必須在 Snowball 準備的 90 天內完成。

問:Snowball 支援哪些網路界面?

Snowball 具備 10 Gbps 的網路界面,其中包含 RJ45、SFP+ 銅纜和 SFP+ 光纖網路連接埠。

問:Snowball 預設的運送選項為何?是否可選擇急件運送?

Snowball 預設透過 UPS 提供 2 天運送服務。如果您的任務有時間急迫性,則可以選擇急件運送。

問:哪些區域可以使用 Snowball?

請參閱區域服務可用性頁面,取得最新資訊。

全美各州都可使用 Snowball。

請注意,50 TB 模式只能在美國使用。

問:是否可以將 Snowball 運送到其他 AWS 區域?

否。Snowball 設計成在單一 AWS 區域內請求和使用。不能在一個區域請求,然後送回另一個區域。用來在歐洲的 AWS 區域匯入或匯出的 Snowball 裝置,可以在 28 個歐盟國家中的任一國家使用。


問:何時應考慮使用 Snowball 而非網際網路?

如果您需要安全迅速地傳輸數 TB 甚至數 PB 的資料到 AWS,Snowball 是一個值得信賴的資料傳輸選項。如果您不想投入昂貴資金升級網路基礎設施,或者不希望經常發生資料大量積存,還是您位於實體隔離的環境、不提供高速網際網路連線或限於成本的區域中,Snowball 也都會是正確的選擇。

根據經驗,如果使用現有網際網路連線的備用容量將資料上傳至 AWS 需要超過 1 週的時間,就應考慮使用 Snowball。例如,按照下表中的指導方針,如果您有專供資料傳輸之用的 100 Mb 連線,而且需要傳輸 100 TB 的資料,則透過該連線需要超過 100 天才能完成資料傳輸。您可以使用多個 Snowball 在約一週內進行相同的傳輸。

可用的網際網路連線 在理論上以 80% 網路使用率傳輸 100 TB 資料的最短天數 何時應考慮使用 AWS Snowball?
T3 (44.736 Mbps) 269 天 2 TB 或更多
100 Mbps 120 天
5 TB 或更多
1000 Mbps 12 天
60 TB 或更多

問:何時應考慮使用 Snowball 而非 AWS Direct Connect?

AWS Direct Connect 提供從現場部署到 AWS 網路的專用快速連線。如果需要持續傳輸大量資料至 AWS,則 AWS Direct Connect 可能是您的理想之選。

如果您需要從各個分散的位置以大批或一次性的方式傳輸資料,則 Snowball 會是比 Direct Connect 更適合的選擇。相較於設定新的 Direct Connect 連線來傳輸資料,然後在完成時終止連線,Snowball 可為這些工作負載提供更簡易、更經濟實惠的選項。

問:何時應考慮使用 Snowball 而非 AWS Import/Export Disk?

相較於 AWS Import/Export Disk,Snowball 可為多數使用案例提供更快速、更簡易且更經濟實惠的體驗。

使用 Snowball,不用購買任何硬體或編寫任何程式碼,即可傳輸您的資料。每個 Snowball 設備都可傳輸最多 80 TB 的資料,而您還可平行使用多個設備以應付更龐大的工作負載。Snowball 使用反竄改隨函附件、256 位元加密,及產業標準信賴平台模組 (TPM),其設計旨在確保資料的安全與完整監管鏈,還有減少將資料傳入或傳出 AWS 的相關管理開銷。

您可以直接從 AWS 管理主控台建立傳輸任務。當傳輸完成且準備將設備送回時,E Ink 運送標籤會自動更新以指示要寄往的正確 AWS 設施,您可以透過 Amazon SNS、文字訊息或直接在主控台追蹤任務狀態。

問:是否可使用 Snowball 將資料從一個 AWS 區域遷移到另一個 AWS 區域?

否。Snowball 旨在做為資料傳輸解決方案,用於將大量資料傳入和傳出指定的 AWS 區域。對於需要在 AWS 區域之間傳輸資料的使用案例,建議您使用 S3 跨區域複寫做為替代方案。


問:Snowball 是否會加密資料?

Snowball 以 256 位元加密對所有資料進行加密。您可以使用 AWS Key Management Service (AWS KMS) 來管理加密金鑰。您的金鑰絕對不會傳送到設備或存放在設備上。

問:AWS 有沒有可用來辨識設備是否在傳輸過程中遭到竄改的方法?

除了使用反竄改隨函附件以外,Snowball 還使用產業標準信賴平台模組 (TPM),其配備的專用處理器可偵測硬體、韌體或軟體中任何未經授權的修改。AWS 會檢查每個設備是否有任何竄改的跡象,以驗證 TPM 未偵測到有任何改變。

問:當設備上的資料成功傳輸至 AWS 後會出現什麼情況?

當處理和驗證完資料傳輸任務之後,AWS 會執行 Snowball 設備的軟體清除,依照國家標準技術研究所 (NIST) 指導方針進行媒體處理。

問:是否有方法輕鬆追蹤資料傳輸任務?

Snowball 使用創新的 E Ink 運送標籤,旨在確保設備能自動寄送至正確的 AWS 設施,而且也有助於進行追蹤。當您完成資料傳輸任務時,就可以透過 Amazon SNS、文字訊息及主控台進行追蹤。

問:是否可使用 AWS Snowball 處理受保護的醫療資訊 (PHI) 資料?

是。AWS Snowball 是 HIPAA 合格服務。如果您目前與 AWS 簽訂商業夥伴協定 (BAA),則可立即開始使用 Snowball 將資料傳入 HIPAA 帳戶。


問:如何開始使用 Snowball?

若要開始使用 Snowball,請瀏覽入門頁面。

問:如何將資料傳輸至 Snowball 設備?

當您將 Snowball 設備連接到網路並使用 E Ink 顯示設定 IP 地址後,需要從 AWS 管理主控台下載 3 個項目:

1. Snowball 用戶端:用來將資料從現場部署儲存傳輸至 Snowball 設備的軟體工具。如需 Snowball 用戶端的詳細資訊,請參閱工具頁面。

2. 任務資訊清單檔案:用來唯一識別資料傳輸任務的加密中繼資料檔。

3. 任務資訊清單解鎖碼:可解鎖任務資訊清單檔案的 25 字元碼。

當您下載完這些檔案之後,啟動 Snowball 用戶端,再提供 Snowball 設備的 IP 地址、資訊清單檔案路徑及解鎖碼。Start 命令範例如下:

snowball start -i {Snowball IP} -m path/to/the/job/manifest} -u {unlock code}

在您啟動用戶端和提供此資訊之後,用戶端現在可以連接到 Snowball 設備並準備好可供使用。接下來,您必須識別要傳輸至設備的檔案目錄,然後等待傳輸完成。Copy 命令範例如下:

snowball cp /path/to/data/on/source/storage/device/directories Snowball/bucketname

問:當資料已傳輸至 Snowball 設備後該怎麼做?

當資料傳輸任務完成時,Snowball 設備的 E Ink 顯示畫面會自動更新回郵標籤,以指示要寄往的正確 AWS 設施。只要將 Snowball 設備送至離您最近的 UPS 運送設施就大功告成了。您可以使用 Amazon SNS、文字訊息或直接在 AWS 管理主控台追蹤運送任務的狀態。

問:是否可以將資料從 Hadoop 分散式檔案系統匯入 Snowball?

是。您可以使用 Snowball CLI,將資料從 HDFS 叢集複製到 Snowball。若要進一步了解,請參閱 Snowball 文件


問:什麼是 Snowball 匯出功能?

匯出是 Snowball 的一項功能,讓客戶可以從 Amazon Simple Storage Service (Amazon S3) 將 TB 到 PB 規模的資料匯出到現場部署儲存。 

問:如何使用匯出功能從 AWS 取出資料?

要使用 Snowball 匯出,只需登入 AWS 管理主控台,選擇 Snowball,然後建立匯出任務。和匯入任務一樣,您要指定想要使用的區域與儲存貯體。如果您不要匯出特定儲存貯體的所有資料,則可指定以 UTF-8 二進位順序存放的開始與結束 S3 金鑰範圍,以指示應該匯出哪些資料。您選擇的金鑰範圍及其中的所有金鑰都會匯出。使用主控台的詳細資訊,請參閱這裡

問:多快可以存取匯出的資料?

我們通常會在收到要求後的 24 小時內開始匯出您的資料,而匯出資料最長需要一週的時間。一旦完成任務且準備好設備,我們就會使用您在建立任務時選取的運送選項將設備寄送給您。

問:是否可自行從資料中心領取 Snowball,這樣就不需要等候運送?

否。然而您可以選取一天時間的運送,我們會確實將 Snowball 運送到您提供的地址。我們不提供您自行從資料中心領取 Snowball 的選項。

問:是否可在準備我的 Snowball 時追蹤匯出資料寫入進度?

是。您可以看到我們開始佈建 Snowball 的時間,以及資料寫入設備時的即時更新。和匯入任務一樣,當佈建完成和設備已運送時您都會收到通知。

問:AWS 將資料複製到 Snowball 之前是否會先加密?

是。所有寫入的資料都會經過加密,而且該資料的加密金鑰絕對不會出現在 Snowball。

問:收到設備時,如何從 Snowball 讀取資料?

您可以使用 Snowball 用戶端將資料從 Snowball 複製到本機儲存。用戶端從 Snowball 讀取資料時會予以解密,並將資料以在 Amazon S3 存放的相同格式寫入本機儲存。

問:我可以匯出多少資料?

您可以匯出的資料量沒有限制。如果您要匯出超過一部設備可以容納的資料量,系統會自動為您建立額外的匯出任務,以匯出所選取的所有資料。

問:是否可從多個儲存貯體擷取資料?

是。您可以為匯出選取所需的任意數目儲存貯體。

問:將我的 Amazon S3 物件複製到本機儲存時,這些物件如何對應到檔案?

每個金鑰會複製到設備中以儲存貯體名稱開頭的樹狀目錄。例如,如果金鑰為 "images/orange.jpg",而儲存貯體為 "fruit",則物件會儲存到 /fruit/images/orange.jpg。與每個物件關聯的中繼資料不會複製到您的儲存設備。

問:是否可以匯出 Amazon Glacier 儲存類別中的資料?

否。必須先使用 S3 生命週期恢復功能將資料恢復到 Amazon S3,才能匯出 Amazon Glacier 資料。

問:是否會取得匯出項目的日誌?

是。針對每個任務,不管是匯入或匯出,都會產生已複製和不可複製的檔案日誌,並可從 Snowball 主控台存取。

問:匯出資料的費用是多少?

除了在我們定價頁面詳述的 Snowball 匯出費用之外,您還需要支付從所有 Amazon S3 與 Amazon Glacier 服務擷取資料的費用。


問:使用 Snowball 傳輸資料的費用為何?

每個 Snowball 資料傳輸任務費用是固定的,包含設備處理及在 AWS 資料中心進行的匯入與匯出操作費用。您可在自己的場所免費使用 Snowball 10 天。收到設備及寄送設備的那兩天不算在這 10 天內。之後,Snowball 設備在您場所的每個額外天數費用為 15 USD/天。將資料傳入 AWS 無須費用。將資料從 AWS 傳出的成本則視區域而定,請參閱我們的定價頁面以了解定價詳情。

以下範例說明 80 TB 模式的 Snowball 定價。

範例:

假設您要用 1 個 Snowball 將 60 TB 的資料傳入 AWS 並想使用 Snowball 14天 (在第 1 天從運送方收到 Snowball,並在第 14 天將 Snowball 送回運送方)。

這個任務的服務費用:

這個任務的服務費用為 250 USD。

額外天數費用:

您可在自己的場所免費使用 Snowball 10 天。收到設備及運送設備的那兩天不算在這 10 天內,也就是說在此案例中,第 1 天和第 14 天為免費。在第 1 天和第 14 天中間有 12 天,而這 12 天之中有 10 天是免費的。剩餘的 2 天是用來傳輸資料的額外 2 天。額外天數的總費用:

2 天 x 15 USD/天 = 30 USD

資料傳輸:

在此範例中,您將資料傳入 AWS,因此資料傳輸費用為免費。

運費:

運送費用是根據運送目的地與所選的運送選項來決定 (例如,隔夜或兩天)。

問:使用 Amazon S3 的費用為何?

Snowball 會代表您將資料從 Snowball 設備傳輸至 AWS 服務,例如 Amazon S3。以標準 AWS 服務費計算。傳入 AWS 的資料不會收取任何資料傳輸費用,存放在 S3 的資料則依標準 Amazon S3 定價計費。

問:是否可以購買 Snowball 設備?

Snowball 只以按照每個任務依用量付費的方式提供,而不提供購買。


問:Snowball 服務是否支援 API 存取?

是。Snowball Job Management API 提供以程式設計方式存取 Snowball 的任務建立和管理功能。這是一個簡單且以標準為基礎的 REST Web 服務界面,其設計可使用任何網際網路開發環境。

問:Snowball Job Management API 可以執行哪些操作?

這個 API 可讓合作夥伴和客戶建置自訂整合,以管理請求 Snowball 和溝通任務狀態的程序。這個 API 也提供簡單的 Web 服務界面,您可用這個界面從 Web 上的任何地方建立、列出、更新和取消任務。開發人員使用這個 Web 服務可輕鬆地建置用來管理 Snowball 任務工作流程的應用程式。若要進一步了解,請參閱 Snowball 文件

問:什麼是 S3 轉接器?

S3 轉接器為 Snowball 用戶端提供一個與 S3 相容的界面,可在 Snowball 上讀取和寫入資料。

問:S3 轉接器可以執行哪些操作?

S3 轉接器提供與 Snowball 通訊的功能,讓客戶建置從檔案和非檔案來源複製資料的工具。它包含將資料複製到 Snowball 的界面,使用透過 Snowball 命令列工具提供的相同加密。若要進一步了解,請參閱 Snowball 文件

問:為什麼應該使用 S3 轉接器而不是 Snowball 用戶端?

Snowball 用戶端是易於將檔案資料複製到 Snowball 的一整套工具。偏好緊密整合的客戶可使用 S3 轉接器輕鬆擴展他們現有的應用程式和工作流程,與 Snowball 無縫地整合。

問:使用 S3 轉接器時如何保護資料的安全?

S3 轉接器使用與 Snowball 用戶端提供的相同進階加密機制來寫入資料。

問:Snowball S3 轉接器支援哪些程式設計語言?

S3 轉接器透過與語言無關的 REST 進行通訊。