存档

数据以“存档”形式存储在 Amazon Glacier 中。 存档可以包括照片、视频或文档等任何数据。您可以将单个文件上传为存档,也可以将多个文件打包成 TAR 或 ZIP 文件并上传存档。

单个存档最大可达 40TB。您可以在 Amazon Glacier 中存储任意数量的存档和任意容量的数据。每个存档在创建时都会分到一个唯一的存档 ID,存档的内容是不变的,也就是说,存档一经创建,就无法再更新。

文件库

Amazon Glacier 使用“文件库”作为存储存档的容器。您可以在 AWS 管理控制台中查看您的文件库列表,并使用 AWS 软件开发工具包执行各种文件库操作,如创建文件库、删除文件库、列出文件库元数据、检索文件库清单、标记文件库以进行筛选和配置文件库通知等。此外,您还可以为每个文件库设置访问策略,授予或拒绝用户的特定操作。一个 AWS 账户可拥有多达 1000 个文件库。

主要功能

数据检索功能

Amazon Glacier 为您的存档提供三种检索功能,以满足不同的访问时间和成本要求,它们是:加急、标准和批量检索。使用加急取回请求的存档通常在 1-5 分钟内可供使用,因此在偶尔需要紧急请求存档子集时,可以快速访问您的数据。使用标准取回,存档通常在 3-5 小时内可供访问。您也可以使用批量取回,以经济高效的方式(每 GB 低至 0.0025 USD)访问大批量数据,最高可达 PB 级。

了解有关 Amazon Glacier 数据检索功能的更多信息 » 

Amazon Glacier Select

使用 Amazon Glacier Select,可针对 Amazon Glacier 中存储的数据直接运行查询,无需检索整个存档。Amazon Glacier Select 通过允许您从存档中仅处理和查找所需的字节来用于分析,改变存档存储的价值。

现在,您的分析应用程序可以调用 Amazon Glacier Select API,从 Amazon Glacier 存档中仅检索与查询相关的数据。Amazon Glacier Select 将很快实现与 Amazon Athena 和 Amazon Redshift Spectrum 的集成,因此您现在可以将 Glacier 存档视为您的数据湖的一部分。

运行 Glacier Select 之前,必须完全恢复 Amazon Glacier 存档才能使用该数据。客户现在可以使用 Glacier Select 降低成本并从存档数据中获得更多见解。

AWS Snowball 和 Direct Connect 集成

AWS Snowball 可使用便携式存储设备进行传输,从而加快大量数据传入和传出 AWS 的速度。AWS 通过 Amazon 的高速内部网络直接将数据传入和传出存储设备,而不使用 Internet 网络。AWS Snowball 传输大型数据集的速度通常比 Internet 更快,而且比升级连接更加经济高效。您可以使用 AWS Snowball 将数据迁移到云,向客户分发内容,将备份发送到 AWS,并进行灾难恢复。

AWS Direct Connect 服务便于建立一个可连接本地设施和 AWS 的高带宽专线网络。AWS Direct Connect 让您能在数据中心和 AWS 之间直接传输业务重要数据,不仅不需要经过您的 Internet 服务提供商,还能消除网络拥堵。此外,您可利用 AWS Direct Connect 轻松调整连接,满足您的数据传输需求。AWS Direct Connect 提供 1Gbps 和 10Gbps 连接,如果您需要更多容量,也可轻松预置多个连接。

文件库锁定

利用 Amazon Glacier 文件库锁定,您可以通过可锁定的策略,轻松部署并强制遵守单个 Glacier 的控制要求。您可以在某个文件库锁定策略中指定诸如“单写多读”(Write Once Read Many, WORM) 之类的控制,并锁定该策略供将来编辑。锁定后,策略将不可改变,Amazon Glacier 会强制执行指定的控制,以帮助您实现合规性目标。要了解更多信息,请阅读“Amazon Glacier 开发人员指南”中的 Amazon Glacier 文件库锁定部分。

访问控制

Amazon Glacier 使用 AWS Identity and Access Management (IAM) 帮助您安全地控制对 AWS 及您的 Amazon Glacier 数据的访问。您可以在 IAM 中创建用户,为每个 Amazon Glacier 文件库分配单独的安全凭证(即:访问密钥、密码、多重验证设备)和 IAM 策略,允许特定用户执行特定操作。

标记支持

Amazon Glacier 让您能够标记 Glacier 文件库,从而更加轻松地管理资源和成本。标记是您可以定义并与文件库关联的标签,您可以使用标记为 AWS 成本报告等操作增加筛选能力。例如,您可以使用标记跨组织的多个部门或按任何其他分类分配 Glacier 成本和使用情况。有关更多信息,请参见标记 Amazon Glacier 文件库

审核日志

Amazon Glacier 支持 AWS CloudTrail 审计日志功能,其中记录您账户的 Amazon Glacier API 调用并将这些日志文件发送给您。通过这些日志文件,您可以了解对您的 Amazon Glacier 资产所执行的操作。例如,您可以确定过去一个月哪些用户访问过某个文件库,或找出谁在何时删除了某个特定的存档。使用审计日志可帮助您实现针对基于云的存档系统设立的合规性和治理目标。有关更多信息,请参阅使用 Amazon Glacier 的审计日志功能

文件库访问策略

文件库访问策略允许您轻松管理对单个 Glacier 文件库的访问权限。您可以直接在文件库上定义访问策略,将文件库访问权限授予组织内部的用户和业务组,以及外部业务合作伙伴。要了解更多信息,请阅读“Amazon Glacier 开发人员指南”中的管理文件库克访问策略部分。

文件库库存

Amazon Glacier 会维护一份各文件库包含的所有存档的清单,以用于灾难恢复或偶尔调节之目的。文件库清单大约一天更新一次。您可以请求 JSON 或 CSV 文件格式的文件库清单,其中包括存档的大小、创建日期和说明(如上传时有提供)等详细信息。该清单将显示最近一次更新清单时文件库的状态。

数据检索策略

Amazon Glacier 数据检索策略可让您通过在 AWS 控制台中点击几下来定义自己的数据检索限制。您可以将检索限制为“仅限免费套餐”,或者如果您的检索需求超出免费套餐的范围,则可以指定“最大检索速率”来限制您的检索速率并规定检索成本上限。在这两种情况下,Amazon Glacier 都不会接受超过您定义的检索上限的检索请求。要了解更多信息,请阅读“Amazon Glacier 开发人员指南”中的配置数据检索策略部分。

AWS 管理控制台

AWS 管理控制台是一种易于使用的 Web 界面,可用于创建文件库、配置文件库级访问权限和设置数据检索 SNS 通知的功能,您可以使用它访问 Amazon Glacier。此外,该控制台还显示了每个文件库的存储使用概况以及文件库清单的最近一次刷新时间。

AWS 软件开发工具包 (SDK)

使用 AWS 软件开发工具包或基础的 Amazon Glacier API 来上传和检索数据。适用于 Java、.NET、PHP 和 Python (Boto) 的 AWS 开发工具包支持 Amazon Glacier。软件开发工具包库包括了基础的 Amazon Glacier API,可以简化您的编程任务。这些软件开发工具包提供了映射到基础 REST API 的库,可让您轻松构造请求并处理响应。适用于 Java 和 .NET 的 AWS 开发工具包提供了高级和低级 API 库。

低级别 API。

低级别的封装库紧密映射到基础的 Amazon Glacier API,并实现最完善的基础 Amazon Glacier 操作。

高级别 API

高级别的 API 在某些操作上提供了更高层次的抽象,进一步简化了应用程序的开发。例如,在上传存档时,高级别的 API 会自动计算校验和。

集成 Amazon S3 的生命周期管理功能

Amazon Glacier 可与 Amazon S3 生命周期规则配合,帮助您自动存档 Amazon S3 数据,并降低您的总体存储成本。您可以轻松设置一条规则,将所有之前的 Amazon S3 对象版本存储在成本较低的 Glacier 存储类中,并在 100 天后从 Glacier 存储中删除。本例将提供 100 天的窗口,可回滚针对您数据的任意更改,并自动降低存储成本。有关生命周期配置以及将数据对象转移到 Amazon Glacier 的更多信息,请转到 Amazon Simple Storage Service 开发人员指南中的对象生命周期管理。 

保护您的数据

默认情况下,存储在 Amazon Glacier 中的数据受到保护;只有文件库所有者才有权访问其创建的 Amazon Glacier 资源。默认情况下,Amazon Glacier 会加密您的静态数据,并支持通过 SSL 进行安全地数据传输。此外,其还支持符合 Identity and Access Management (IAM) 政策的访问控制机制。借助 Amazon Glacier 的数据保护功能,您可以保护数据以防出现逻辑和物理故障,防止因用户意外操作、应用程序错误及基础设施故障而导致数据丢失。对于必须遵守 PCI 和 HIPAA 等法规标准的客户,Amazon Glacier 的数据保护功能可用作实现合规性的总体策略的一部分。下面将详细介绍 Amazon Glacier 提供的各种数据安全和可靠性功能。

默认加密

Amazon Glacier 会通过高级加密标准 (AES) 256 位对称密钥自动加密静态数据,并支持通过安全套接字层 (SSL) 进行安全的数据传输。

不可变的存档

存储在 Amazon Glacier 中的数据是不可变的,也就是说,存档一经创建,就不能再更新了。这可确保法律和法规记录等数据在存档后不会遭到修改。

了解有关 Amazon Glacier 存档的更多信息 »

符合 IAM 政策的灵活的访问控制

Amazon Glacier 支持 Identity and Access Management (IAM) 政策,让拥有多名员工的组织能够在一个 AWS 账户下创建和管理多名用户。通过 IAM 政策,您可创建更加细致的政策,以控制您的 Amazon Glacier 文件库。您可通过编写 IAM 政策来有选择地授予或撤销每个 Amazon Glacier 文件库的特定权限和操作。

强制性的请求签名

Amazon Glacier 要求所有请求都必须经过签名,以实现身份验证保护。要对请求进行签名,可利用加密哈希函数来计算数字签名:该函数会返回一个哈希值,您可将其包含在请求中用作签名。收到您的请求后,Amazon Glacier 会使用您在处理该请求前用来对请求签名的相同哈希函数和输入重新计算签名。

了解有关 Amazon Glacier 请求签名的更多信息 »

数据持久性和可靠性

Amazon Glacier 提供了高持久性的存储基础设施,可实现长期的数据存档存储。旨在提供 99.999999999% 的存档平均年存储耐久性。服务在多个 AWS 可用区 (AZ) 以及每个 AZ 内的多个设备中冗余地存储数据。为提高持久性,Amazon Glacier 会在确认成功上传前将您的数据同步存储至多个 AZ。

为避免数据包在线路传输中损坏,Amazon Glacier 会在数据上传期间上传数据的校验和。其将收到的校验和与收到的数据的校验和进行对比,以检测线路传输过程中是否发生了位翻转。类似地,其会在数据检索期间通过校验和来验证数据的真实性。不同于需要费时耗力的数据验证和手工修复的传统系统,Amazon Glacier 可以定期对系统数据执行完整性校验,并且内置了自动自我修复能力。

了解有关数据校验和的更多信息 »

管理您的数据

Amazon Glacier 中的存档操作

Amazon Glacier 支持以下存档操作:上传、下载和删除。存档是不可变的,无法更改。

向 Amazon Glacier 上传存档

上传存档是一种同步操作。您可以在一个操作中上传存档,或借助 MultipartUpload API 将较大的存档分成多个部分上传,以提高吞吐量和容错性。您能够上传 1 字节至 40TB 的存档。存档永久存储后,您会收到一个唯一的存档 ID。有关使用 MultipartUpload 提高吞吐量的最佳时机的更多信息,请参阅在 Amazon Glacier 中上传存档

从 Amazon Glacier 下载存档

下载存档是一种异步操作。您必须先启动检索特定存档的作业。收到任务请求后,Amazon Glacier 会准备要下载的存档。作业完成后,您有 24 个小时的时间从中转位置下载数据。

删除 Amazon Glacier 中的存档

要删除存档,您需要使用 Amazon Glacier REST API 或 AWS 开发工具包并指定存档 ID。此外,您也可以使用一系列第三方工具来删除存档。有关更多信息,请参阅删除 Amazon Glacier 中的存档

预期用途和限制

使用本服务需遵循 Amazon Web Services 客户协议

了解有关 Amazon Glacier 定价的更多信息

访问定价页面
准备好开始构建了吗?
开始使用 Amazon Glacier
还有更多问题?
联系我们