一般性问题

问:什么是 AWS Snowball?

AWS Snowball 是一种数据传输解决方案,它通过使用能够以物理方式安全传输的存储设备来加快 TB 到 PB 级数据迁入和迁出 AWS 的速度。使用 Snowball 有助于解决进行大规模数据传输时会遇到的难题,包括网络费用高、传输时间长和安全问题。

问:Snowball 的工作原理是什么?

AWS Snowball 使用专为确保安全而设计的设备和 Snowball 客户端来加速 PB 级数据迁入和迁出 AWS 的速度。首先,您要使用 AWS 管理控制台创建一项或多项任务,申请一台或多台 Snowball 设备(具体取决于您需要传输的数据量),然后下载并安装 Snowball 客户端(简称“客户端”)。当设备抵达后,将其连接到您的本地网络,手动或使用 DHCP 设置 IP 地址,然后使用客户端确定要复制的目录。客户端会自动加密数据并将其复制到设备,然后在传输任务完成时通知您。传输完成且您已准备好返还设备时,电子墨水运输标签会自动更新,以指示要运送到的正确 AWS 机构,您可以通过 Amazon Simple Notification Service (SNS)、短信或直接在控制台中跟踪任务状态。

问:Snowball 适合什么样的用户使用?

如果您需要更加安全快速地将数 TB 到数 PB 数据传输到 AWS,那么 Snowball 是数据传输的合适选择。如果您不希望对网络基础设施进行昂贵的升级、您经常遇到大量数据积压的情况、您在物理隔绝环境下工作,或者您所在的区域没有高宽带 Internet 连接或这种连接的成本过高,Snowball 同样是正确的选择。

问:使用 Snowball 可传输多少数据?

借助 Snowball,您可以同时或相继使用多台设备传输几乎任何数量的数据。例如,可以使用两台 80TB 设备一次移动 150TB 数据,也可以先订购一台设备来移动 80TB 数据,然后再订购一台来移动剩余的 70TB 数据。 

问:什么是 Snowball 客户端?

AWS Snowball 客户端是您安装在本地主计算机上的软件,可帮助您高效识别、压缩、加密您指定的目录中的数据并将其传输到 Snowball。您可以在此处下载 Snowball 客户端。

问:传输数据需要多长时间?

您可以使用 AWS Snowball 客户端来估算传输您的数据所需的时间(AWS Snowball 传输详细信息)。数据传输速度受很多因素影响,其中包括本地网络速度、文件大小以及从本地服务器读取数据的速度。

Snowball 客户端将以条件允许的最快速度将数据复制到 Snowball(例如,不到一天就可以复制 48TB 的数据,具体取决于您的本地环境)。将数据传输到 AWS 的端到端时间约为一周,包括常规的运送时间和在 AWS 数据中心的处理时间。您可以同时使用两台 Snowball 设备在同样的时间内复制两倍的数据,也可以使用一台较大的 Snowball 设备在两天半的时间里复制最多 80TB 数据,如果采用后面这种方式,端到端时间会增加到一周半左右。

问:Snowball 设备的相关规范有哪些?

请参阅此 AWS Snowball 文档页面,查看硬件规范的完整列表,其中包括接口、散热和电源要求、输出分贝和尺寸。

问:我在执行特定任务时可以持有 Snowball 多长时间?

为安全起见,您必须在 Snowball 就绪后的 90 天内完成数据传输。使用一台 Snowball 设备时,您应该有足够的时间传输最多 80TB 数据。

问:Snowball 支持哪些网络接口?

Snowball 拥有 10Gbps 的网络接口,配有 RJ45、SFP+ 铜缆和 SFP+ 光纤网络端口。请参阅 AWS Snowball 规格页面,了解更多详细信息。

问:Snowball 的默认送货方式是什么? 我可以选择加急运送吗?

默认情况下,Snowball 使用 UPS 的“两日送达”。如果您的作业具有时效性,可以选择加急运送。

区域可用性

问:在哪些区域可以使用 Snowball?

请参阅区域服务可用性页面,了解最新信息。

Snowball 在美国各州均可用。

请注意,50TB 型号仅在美国提供。

问:能否将 Snowball 运到其他 AWS 区域?

不能,您只能在一个 AWS 区域中请求和使用 Snowball。不能从一个区域提出请求,然后返回到另一个区域。用于从欧盟 AWS 区域进行导入或导出的 Snowball 设备可在所有 28 个欧盟国家/地区使用。请参阅区域服务可用性页面,了解最新信息。

何时使用 Snowball

问:何时应考虑使用 Snowball 而不是 Internet?

如果您需要更加安全快速地将数 TB 到数 PB 数据传输到 AWS,那么 Snowball 是数据传输的一个有效选择。如果您不希望对网络基础设施进行昂贵的升级、您经常遇到大量数据积压的情况、您在物理隔绝环境下工作,或者您所在的区域没有高速 Internet 连接或这种高速连接的成本过高,Snowball 同样是正确的选择。

根据以往的经验,如果使用现有 Internet 连接的空闲容量将数据上传到 AWS 需时超过一周,则您应考虑使用 Snowball。例如,根据下表中的指南,如果您有 100Mb 的连接可完全用于传输数据,并且有 100TB 的数据需要传输,那么使用该连接完成数据传输所需的时间会超过 100 天。而使用多台 Snowball 进行同样的传输,仅需一周左右。

可用的 Internet 连接 在 80% 网络使用率时在 80% 网络使用率时传输 100TB 数据 何时考虑使用 AWS Snowball?
T3 (44.736Mbps) 269 天 2TB 或以上
100Mbps 120 天
5TB 或以上
1000Mbps 12 天
60TB 或以上

问:何时应考虑使用 Snowball 而不是 AWS Direct Connect?

AWS Direct Connect 提供从本地到 AWS 网络的专用高速连接。如果您需要持续向 AWS 传输大量的数据,AWS Direct Connect 也许是正确的选择。

问:是否可以使用 Snowball 将数据从一个 AWS 区域迁移到另一个 AWS 区域?

不可以,Snowball 的用途是充当将大量数据传入和传出指定 AWS 区域的数据传输解决方案。对于需要在多个 AWS 区域之间进行数据传输的情况,我们建议您使用 S3 跨区域复制作为替代解决方案。

问:Snowball 和 Snowball Edge 之间有什么差异?

Snowball 的用途是充当将大量数据传入和传出指定 AWS 区域的数据传输解决方案。Snowball Edge 添加了额外的功能,可以在设备上运行简单的计算功能,适合需要在将数据返回 AWS 之前进行本地处理的用例。有关更多详细信息,请参阅该文档

安全性

问:Snowball 会加密我的数据吗?

Snowball 使用 256 位加密算法加密所有数据。您可以使用 AWS Key Management Service (KMS) 管理加密密钥。您的密钥绝不会发送给设备或存储在设备上。

问:AWS 有没有办法判断设备在途中是否遭到篡改?

Snowball 使用了防篡改外壳,并采用了行业标准的可信平台模块 (TPM),后者使用了专用处理器,旨在检测对硬件、固件或软件进行的任何未经授权的修改。AWS 将检查每台设备是否有任何拆封痕迹,并确认 TPM 未检测到任何更改。

问:设备上的数据成功传输到 AWS 后会如何?

处理并验证完数据传输任务后,AWS 将遵循美国国家标准技术局 (NIST) 的介质清理准则对 Snowball 设备执行软件擦除。

问:有没有什么办法能轻松地跟踪我的数据传输任务?

Snowball 使用创新型电子墨水运输标签,用于确保设备会自动发送至正确的 AWS 机构,并且还会在跟踪过程中提供帮助。当您完成数据传输任务后,可以通过 Amazon Simple Notification Service (SNS)、短信或控制台对其进行跟踪。

问:是否可以对包含受保护健康信息 (PHI) 的数据使用 AWS Snowball?

可以。AWS Snowball 这项服务符合 HIPAA 的要求。如果您目前已与 AWS 签订了商业伙伴协议 (BAA),则可以立即开始使用 Snowball 向您的 HIPAA 账户传输数据。

使用 Snowball 导入数据

问:如何开始使用 Snowball?

要开始使用 Snowball,请访问 AWS Snowball 入门页面。

问:如何将我的数据传输到 Snowball 设备?

将 Snowball 设备连接到网络并使用电子墨水显示屏设置 IP 地址后,您需要从 AWS 管理控制台下载三个文件:

1.Snowball 客户端:用于将数据从您的本地存储传输到 Snowball 设备的软件工具。有关 Snowball 客户端的更多信息,请参阅 AWS Snowball 资源页面。

2.任务清单文件:一个加密的元数据文件,用于唯一地标识您的数据传输任务。

3.任务清单解锁代码:由 25 个字符组成的代码,用于解锁任务清单文件。

下载完上述文件后,请启动 Snowball 客户端,并提供 Snowball 设备的 IP 地址、清单文件路径和解锁代码。启动命令示例如下:

  snowball start -i {Snowball IP} -m path/to/the/job/manifest} -u {unlock code}

在您启动客户端并提供该信息后,客户端即可连接至 Snowball 设备,并可投入使用。接下来,您需要确定要传输到设备的文件目录,并等待传输完成。复制命令示例如下:

  snowball cp /path/to/data/on/source/storage/device/directories Snowball/bucketname

问:将数据传输到 AWS Snowball 的建议最佳实践有哪些?

为了加快复制速度,我们建议使用功能强大的工作站在多个终端中同时运行 Snowball 客户端的实例,并批量传输小文件。Snowball 客户端通过自动以批量方式将小文件分配到较大的 .snowballarchives 文件中来提高小文件的传输性能。当压缩的批量文件导入 Amazon S3 后,它们会自动扩展,因此您无需自行扩展文件。请参阅 Snowball 文档页面,查看 AWS Snowball 最佳实践的完整列表。

问:当数据传输到 Snowball 设备之后,我需要做什么?

数据传输任务完成后,Snowball 设备的电子墨水显示屏将自动更新回邮标签,以指示要运送到的正确 AWS 机构。您只需将 Snowball 设备交给离您最近的承运商运输机构即可。您可以通过 Amazon Simple Notification Service (SNS)、短信或直接在 AWS 管理控制台中跟踪传输任务的状态。

问:是否可以将数据从 Hadoop 分布式文件系统导入 Snowball?

可以。您可以使用 Snowball CLI 将数据从 HDFS 群集复制到 Snowball。有关更多信息,请参阅 AWS Snowball 文档

使用 Snowball 导出数据

问:什么是 Snowball 的导出功能?

导出是 Snowball 的一项功能,它支持客户将数 TB 到数 PB 数据从 Amazon Simple Storage Service (S3) 导出到本地存储。

问:如何使用导出功能从 AWS 导出数据?

要使用 Snowball 的导出功能,只需登录 AWS 管理控制台,选择“Snowball”,然后创建导出任务即可。与导入作业一样,您需要指定要使用的区域和存储桶。如果您不希望从特定存储桶中导出所有数据,您可以指定一个按照 UTF-8 二进制顺序排序的 S3 密钥开始和结束范围,用以标明应该导出的数据。您所选择的密钥范围以及位于其中的所有密钥都将被导出。此处提供了有关使用 AWS 管理控制台的更多详细信息。

问:我最快多久能够访问导出的数据?

我们通常会在收到申请之后的 24 小时内开始导出数据,导出数据可能需时一周。任务完成且设备就绪后,我们将使用您在创建任务时选择的发货选项将其发送给您。

问:我能否直接从您的数据中心取走 Snowball,以免去等待送货的过程?

不可以,尽管您可以选择一日送达的方式,但我们仍然需要将 Snowball 配送到您所提供的地址。我们不提供直接从我们的数据中心取走 Snowball 设备这种方式。

问:在您为我准备 Snowball 的同时,我是否可以跟踪导出数据写入的进展情况?

可以。您可以看到我们何时开始预置 Snowball,并在向设备写入数据时获得实时更新。与导入任务一样,您会在预置完成时和设备发货时收到通知。

问:在将数据复制到 Snowball 之前,AWS 会加密我的数据吗?

可以。所有写入数据均会经过加密,且这些数据的加密密钥绝不会显示在 Snowball 上。

问:收到 Snowball 后,如何从该设备上读取数据?

您可以使用 AWS Snowball 客户端将数据从 Snowball 复制到本地存储。客户端从 Snowball 读取数据时会将其解密,并以数据存储到 Amazon S3 的相同格式将其写入您的本地存储。

问:我可以导出多少数据?

该设备对于您能导出的数据量几乎没有任何限制。如果您想要导出的数据超出一台设备所能容纳的数量,则可以创建其他导出任务,以便导出所选的所有数据。您将需要支付标准导出费用。

问:是否可以从多个存储桶检索数据?

可以。您可以根据需要选择用于导出的存储桶数目。

问:将 Amazon S3 对象复制到本地存储时,如何将其映射到文件中?

每个密钥都会复制到设备中以存储桶名称开头的一个目录树中。例如,如果密钥是“images/orange.jpg”且存储桶是“fruit”,则对象将保存至 /fruit/images/orange.jpg。与各个对象关联的元数据不会复制到您的存储设备中。

问:能否导出 Amazon Glacier 存储类数据?

否,Amazon Glacier 数据需要先还原到 Amazon S3 才能导出。

问:是否有记录导出内容的日志?

可以。对于每项导入或导出作业,Snowball 控制台都会针对被复制和未被复制的文件生成并提供一份日志。

问:导出数据的费用是多少?

除了 AWS Snowball 定价页面上详述的 Snowball 导出费用之外,您还需要支付从 Amazon S3Amazon Glacier 服务中检索数据所产生的所有费用。

计费

问:使用 Snowball 传输数据的费用是多少?

每项 Snowball 数据传输作业均需要针对设备处理和在 AWS 数据中心进行的导入/导出操作支付固定费用。您可以在自己的场所免费使用 Snowball 10 天。这 10 天不包括收到设备和寄送设备的日子。如果超过 10 天,Snowball 设备将按每超一天 15 USD 的价格收费。将数据传入到 AWS 不收取任何费用。将数据传出 AWS 的费用因区域而异,请参阅我们的 AWS Snowball 定价页面了解定价详情。

以下示例说明了型号为 80TB 的 Snowball 的定价。

例如:
假定您使用一台 Snowball 将 60TB 的数据传入到了 AWS,您使用 Snowball 14 天(在第 1 天收到承运商送到的 Snowball,在第 14 天将 Snowball 返回给承运商)。

该项作业的服务费如下:
该项作业的服务费为 250 USD。

超出后的每天费用:
您可以在自己的场所免费使用 Snowball 10 天。这 10 天不包括收到设备和寄送设备的日子,也就是说,本例中,第 1 天和第 14 天不收费。在第 1 天和第 14 天之间共有 12 天,其中有 10 天不收费。其余两天是用于传输数据所超出的 2 天。超出天数的总费用为:
2 天 x 15 USD/天 = 30 USD

数据传输:
在本示例中,您是将数据传入 AWS,因此数据传输费用为零。

装运:
运费是基于您的配送目的地和所选的发货选项(例如,隔夜送达、两天送达)来计算的。

问:Amazon S3 是如何收费的?

Snowball 代您将数据从 Snowball 设备传输到 AWS 产品(如 Amazon S3),而您需要支付标准的 AWS 产品费用。传 AWS 的数据不会产生任何数据传输费用,S3 中存储的数据按照标准 Amazon S3 定价计费。

问:我可以购买 Snowball 设备吗?

Snowball 只针对任务按实际使用量收费,不可购买。

工作流集成工具

问:Snowball 服务是否支持 API 访问?

可以。Snowball 任务管理 API 提供对 Snowball 任务创建和管理功能的编程式访问。这是一种基于标准的简单 REST Web 服务接口,旨在与任何 Internet 开发环境配合使用。

问:Snowball 任务管理 API 有何用途?

借助 AWS Snowball 任务管理 API,合作伙伴和客户可以构建自定义集成,用以管理请求 Snowball 和传递任务状态的流程。该 API 提供了一种简单的 Web 服务接口,可用于从 Web 上的任意位置创建、列出、更新和取消任务。使用此 Web 服务,开发人员可以轻松构建管理 Snowball 任务的应用程序。要了解更多信息,请参阅 AWS Snowball 文档

问:什么是 S3 Adapter?

S3 SDK Adapter for Snowball 可以为 Snowball 客户端提供兼容 S3 的接口,以便在 Snowball 上读取和写入数据。

问:S3 Adapter 有何用途?

S3 Adapter 提供可与 Snowball 进行通信的功能,从而允许客户构建用于从文件以及非文件源复制数据的工具。它包括将数据复制到 Snowball 的接口,所采用的加密方法与通过我们的 Snowball 命令行工具所使用的加密方法相同。有关更多信息,请参阅 AWS Snowball 文档

问:为什么要使用 S3 Adapter 而不是 Snowball 客户端?

Snowball 客户端是一种一站式工具,能够将基于文件的数据轻松复制到 Snowball。钟爱紧密集成的客户可以使用 S3 Adapter 轻松扩展其现有应用程序和工作流以与 Snowball 无缝集成。

问:使用 S3 Adapter 时,如何保障数据安全?

S3 Adapter 写入数据时所用的加密机制与 Snowball 客户端提供的高级加密机制相同。

问:Snowball S3 Adapter 支持哪些编程语言?

S3 Adapter 通过与语言无关的 REST 进行通信。

准备好开始构建?
开始使用 AWS Snowball
还有更多问题?
联系我们