存档

数据以“存档”形式存储在 Amazon S3 Glacier 中。 存档可以包括照片、视频或文档等任何数据。您可以将单个文件上传为存档,也可以将多个文件打包成 TAR 或 ZIP 文件并上传存档。

单个存档最大可达 40TB。您可以在 Amazon S3 Glacier 中存储无限数量的存档和无限量的数据。每个存档在创建时都会分到一个唯一的存档 ID,存档的内容是不变的,也就是说,存档一经创建,就无法再更新。

文件库

Amazon S3 Glacier 使用“文件库”作为存储存档的容器。您可以在 AWS 管理控制台中查看您的文件库列表,并使用 AWS 软件开发工具包执行各种文件库操作,如创建文件库、删除文件库、列出文件库元数据、检索文件库清单、标记文件库,从而进行筛选和配置文件库通知等。此外,您还可以为每个文件库设置访问策略,授予或拒绝用户的特定操作。一个 AWS 账户可拥有多达 1000 个文件库。

主要功能

数据检索功能

Amazon S3 Glacier 为您的存档提供三种检索功能(加急、标准和批量检索)来满足不同的访问时间和成本要求。使用加急检索请求的存档通常在 1-5 分钟内可供使用,因此在偶尔需要紧急请求存档子集时,可以快速访问您的数据。使用标准取回,存档通常在 3-5 小时内可供访问。您也可以使用批量检索,以经济高效的方式(每 GB 低至 0.0025 USD)访问大批量数据,最高可达 PB 级。

了解有关 Amazon S3 Glacier 数据检索功能的更多信息 » 

Amazon S3 Glacier Select

Amazon S3 Glacier Select 允许查询直接运行 Amazon S3 Glacier 中存储的数据,而无需检索整个存档。通过允许您从存档中仅处理和查找所需的字节来用于分析,Amazon S3 Glacier Select 改变了存档存储的价值。

现在,您的分析应用程序可以调用 Amazon S3 Glacier Select API,从 Amazon S3 Glacier 存档中仅检索与查询相关的数据。Amazon S3 Glacier Select 将很快实现与 Amazon Athena 和 Amazon Redshift Spectrum 的集成,因此您现在可以将 S3 Glacier 存档视为您的数据湖的一部分。

运行 S3 Glacier Select 之前,必须完全恢复 Amazon S3 Glacier 存档才能使用该数据。客户现在可以使用 S3 Glacier Select 降低成本,并从存档数据中获得更多见解。

AWS Snowball 和 Direct Connect 集成

AWS Snowball 可使用便携式存储设备进行传输,从而加快大量数据传入和传出 AWS 的速度。AWS 通过 Amazon 的高速内部网络直接将数据传入和传出存储设备,而不使用 Internet 网络。AWS Snowball 传输大型数据集的速度通常比 Internet 更快,而且比升级连接更加经济高效。您可以使用 AWS Snowball 将数据迁移到云,向客户分发内容,将备份发送到 AWS,并进行灾难恢复。

AWS Direct Connect 服务便于建立一个可连接本地设施和 AWS 的高带宽专线网络。AWS Direct Connect 让您能在数据中心和 AWS 之间直接传输业务重要数据,不仅不需要经过您的 Internet 服务提供商,还能消除网络拥堵。此外,您可利用 AWS Direct Connect 轻松调整连接,满足您的数据传输需求。AWS Direct Connect 提供 1Gbps 和 10Gbps 连接,如果您需要更多容量,也可轻松预置多个连接。

文件库锁定

利用 Amazon S3 Glacier 文件库锁定,您可以通过可锁定的策略,轻松部署并强制遵守单个 S3 Glacier 的控制要求。您可以在某个文件库锁定策略中指定诸如“一次写入,多次读取”(WORM) 之类的控制,并锁定该策略供将来编辑。锁定后,策略将不可改变,而 Amazon S3 Glacier 会强制执行指定的控制,以帮助您实现合规性目标。要了解更多信息,请阅读 Amazon S3 Glacier 开发人员指南中的 Amazon S3 Glacier 文件库锁定

访问控制

Amazon S3 Glacier 使用 AWS Identity and Access Management (IAM) 帮助您安全地控制对 AWS 及您的 Amazon S3 Glacier 数据的访问。您可以在 IAM 中创建用户,为每个 Amazon S3 Glacier 文件库分配单独的安全凭证(如访问密钥、密码、多重验证设备)和 IAM 策略,从而允许特定用户执行特定操作。

标记支持

Amazon S3 Glacier 让您能够标记 S3 Glacier 文件库,从而更加轻松地管理资源和成本。标记是您可以定义并与文件库关联的标签,并且使用标记(如 AWS 成本报告)为操作添加筛选功能。例如,您可以使用标记,跨组织的多个部门或按任何其他分类分配 S3 Glacier 成本和使用情况。有关更多信息,请参阅标记 Amazon S3 Glacier 文件库

审核日志

Amazon S3 Glacier 使用 AWS CloudTrail 支持审核日志记录,它记录您账户的 Amazon S3 Glacier API 调用,并将这些日志文件发送给您。通过这些日志文件,可以了解对您的 Amazon S3 Glacier 资产所执行的操作。例如,您可以确定过去一个月哪些用户访问过某个文件库,或找出谁在何时删除了某个特定的存档。使用审核日志记录,可帮助您实现针对基于云的存档系统设立的合规性和监管目标。有关更多信息,请参阅结合使用审核日志记录和 Amazon S3 Glacier

文件库访问策略

文件库访问策略允许您轻松管理对单个 S3 Glacier 文件库的访问权限。您可以直接在文件库上定义访问策略,将文件库访问权限授予组织内部的用户和业务组,以及外部业务合作伙伴。要了解更多信息,请阅读 Amazon S3 Glacier 开发人员指南中的管理文件库访问策略

文件库清单

Amazon S3 Glacier 会维护一份各文件库包含的所有存档的清单,用于灾难恢复或偶尔调节之目的。文件库清单大约一天更新一次。您可以请求 JSON 或 CSV 文件格式的文件库清单,其中包括存档的大小、创建日期和说明(如上传时有提供)等详细信息。该清单将显示最近一次更新清单时文件库的状态。

数据检索策略

Amazon S3 Glacier 数据检索策略可让您通过在 AWS 控制台中点击几下来定义自己的数据检索限制。您可以将检索限制为“仅限免费套餐”,或者如果您的检索需求超出免费套餐的范围,则可以指定“最大检索速率”来限制您的检索速率并规定检索成本上限。在这两种情况下,Amazon S3 Glacier 都不会接受超过您定义的检索上限的检索请求。要了解更多信息,请阅读 Amazon S3 Glacier 开发人员指南中的配置数据检索策略

AWS 管理控制台

您可以使用 AWS 管理控制台访问 Amazon S3 Glacier,该控制台是一种易于使用的 Web 界面,可用于创建文件库,配置文件库级访问权限,并设置数据检索的 SNS 通知。此外,该控制台还显示了每个文件库的存储使用概况,以及文件库清单的最近一次刷新时间。

AWS 软件开发工具包 (SDK)

使用 AWS 软件开发工具包或基础 Amazon S3 Glacier API 来完成数据上传和检索。Amazon S3 Glacier 由适用于 Java、.NET、PHP 和 Python (Boto) 的 AWS 软件开发工具包提供支持。软件开发工具包库打包了基础 Amazon S3 Glacier API,可以简化您的编程任务。这些软件开发工具包提供了映射到基础 REST API 的库,可让您轻松构造请求并处理响应。适用于 Java 和 .NET 的 AWS 开发工具包提供了高级和低级 API 库。

低级别 API

低级别的封装库紧密映射到基础 Amazon S3 Glacier API,并实现最完善的基础 Amazon S3 Glacier 操作。

高级别 API

高级别的 API 在某些操作上提供了更高层次的抽象,进一步简化了应用程序的开发。例如,在上传存档时,高级别 API 会自动计算校验和。

与 Amazon S3 集成的生命周期管理

Amazon S3 Glacier 可与 Amazon S3 生命周期规则配合,帮助您自动存档 Amazon S3 数据,并降低您的总体存储成本。您可以轻松设置一条规则,将所有之前的 Amazon S3 对象版本存储在成本较低的 S3 Glacier 存储类中,并在 100 天后从 S3 Glacier 存储中删除。本例将提供 100 天的窗口,可回滚针对您数据的任意更改,并自动降低存储成本。有关生命周期配置以及将对象转移到 Amazon S3 Glacier 的更多信息,请转到 Amazon Simple Storage Service 开发人员指南中的对象生命周期管理。 

保护您的数据

默认情况下,存储在 Amazon S3 Glacier 中的数据受到保护;只有文件库所有者才有权访问其创建的 Amazon S3 Glacier 资源。默认情况下,Amazon S3 Glacier 会加密您的静态数据,并支持使用 SSL 进行安全数据传输。此外,它还支持具有 Identity and Access Management (IAM) 策略的访问控制机制。借助 Amazon S3 Glacier 的数据保护功能,您可以保护数据,防止出现逻辑和物理故障,避免因用户意外操作、应用程序错误及基础设施故障而导致数据丢失。对于必须遵守 PCI 和 HIPAA 等法规标准的客户,Amazon S3 Glacier 的数据保护功能可用作实现合规性的总体策略的一部分。下面将详细介绍 Amazon S3 Glacier 提供的各种数据安全和可靠性功能。

默认加密

Amazon S3 Glacier 会通过高级加密标准 (AES) 256 位对称密钥自动加密静态数据,并支持通过安全套接字层 (SSL) 进行安全数据传输。

不可变的存档

存储在 Amazon S3 Glacier 中的数据是不可变的,也就是说,存档一经创建,就不能再更新了。这可确保合规性和法规记录等数据在存档后不会遭到修改。

了解有关 Amazon S3 Glacier 存档的更多信息 »

具有 IAM 策略的灵活访问控制

Amazon S3 Glacier 支持 Identity and Access Management (IAM) 策略,让拥有多名员工的组织能够在一个 AWS 账户下创建和管理多名用户。借助 IAM 策略,您可创建更加细致的策略,以控制您的 Amazon S3 Glacier 文件库。通过编写 IAM 策略,您可有选择地授予或撤销每个 Amazon S3 Glacier 文件库的特定权限和操作。

强制性的请求签名

Amazon S3 Glacier 要求所有请求都必须经过签名,以实现身份验证保护。要对请求进行签名,可利用加密哈希函数来计算数字签名,该函数会返回一个哈希值,您可将其包含在请求中用作签名。收到您的请求后,Amazon S3 Glacier 会使用处理该请求前,签署该请求时的相同哈希函数和输入,重新计算签名。

了解有关 Amazon S3 Glacier 请求签名的更多信息 »

数据持久性和可靠性

Amazon S3 Glacier 提供了高持久性的存储基础设施,可实现长期的数据存档存储。旨在提供 99.999999999% 的存档平均年存储持久性。该服务在多个 AWS 可用区 (AZ) 以及每个可用区内的多个设备中冗余地存储数据。为提高持久性,Amazon S3 Glacier 会在确认成功上传前将您的数据同步存储至多个可用区。

为避免数据包在线路传输中损坏,Amazon S3 Glacier 会在数据上传期间上传数据的校验和。它将收到的校验和与收到数据的校验和进行对比,检测线路传输过程中是否发生了位翻转。类似地,它会在数据检索期间通过校验和来验证数据的真实性。不同于费时耗力的数据验证和手工修复的传统系统,Amazon S3 Glacier 可以定期对系统数据执行完整性校验,并且内置了自动自我修复能力。

了解有关数据校验和的更多信息 »

管理您的数据

Amazon S3 Glacier 中的存档操作

Amazon S3 Glacier 支持以下存档操作:上传、下载和删除。存档是不可变的,并且不可修改。

将一个存档上传到 Amazon S3 Glacier

上传存档是一种同步操作。您可以在一个操作中上传存档,或借助 MultipartUpload API 将较大的存档分成多个部分上传,以提高吞吐量和容错性。您能够上传 1 字节至 40TB 的存档。存档永久存储后,您会收到一个唯一的存档 ID。有关使用 MultipartUpload 提高吞吐量最佳时机的更多信息,请参阅在 Amazon S3 Glacier 中上传存档

从 Amazon S3 Glacier 下载存档

下载存档是一种异步操作。您必须先对特定存档启动检索作业。收到作业请求后,Amazon S3 Glacier 会准备要下载的存档。作业完成后,您有 24 个小时的时间从中转位置下载数据。

删除 Amazon S3 Glacier 中的存档

要删除存档,您需要使用 Amazon S3 Glacier REST API 或 AWS 软件开发工具包,并指定存档 ID。此外,您也可以使用一系列第三方工具来删除存档。有关更多信息,请参阅删除 Amazon S3 Glacier 中的存档

预期用途和限制

使用本服务需遵守 Amazon Web Services 客户协议

了解有关 Amazon S3 Glacier 定价的更多信息

访问定价页面
准备好开始构建了吗?
Amazon S3 Glacier 入门
还有更多问题?
联系我们