Amazon S3 存储类别

概述

Amazon S3 提供了一系列存储类,您可以根据工作负载的性能、数据访问权限、弹性和成本要求进行选择。S3 存储类专门用于为不同的访问模式提供最低成本的存储。S3 存储类几乎适用于任何用例,包括具有苛刻性能需求、数据湖、驻留要求、未知或不断变化的访问模式或归档存储的用例。

S3 存储类包括:S3 Intelligent-Tiering,可自动为具有未知或不断变化的访问模式的数据节省成本;S3 Standard,适用于频繁访问的数据;S3 Express One Zone,适用于访问频率较高的数据;S3 Standard-Infrequent Access (S3 Standard-IA)S3 One Zone-Infrequent Access (S3 One Zone-IA),适用于访问频率较低的数据;S3 Glacier Instant Retrieval,适用于需要即时访问的归档数据;S3 Glacier Flexible Retrieval(前称为 S3 Glacier),适用于很少访问且不需要即时访问的长期数据;Amazon S3 Glacier Deep Archive (S3 Glacier Deep Archive),适用于以最低的云存储成本进行长期归档和数字保存。

Amazon S3 提供最持久的云端存储。基于其独特的架构,S3 的数据持久性设计为超过 99.999999999%(11 个 9)。此外,默认情况下,S3 至少跨 3 个可用区冗余存储数据,其内置弹性可应对大范围灾难。客户可以将数据存储在单个可用分区中以最大限度地降低存储成本或延迟,也可以将数据存储在多个可用分区中以防止整个数据中心永久丢失,或者将数据存储在多个 AWS 区域中以满足地理弹性要求。如果您具有现有 AWS 区域无法满足的数据驻留要求,您可以使用 S3 Outposts 存储类将您的 S3 数据存储在本地。

您可以在对象级别配置 S3 存储类,单一通用存储桶可以包含跨所有存储类(S3 Express One Zone 除外)的对象。Amazon S3 还提供在整个数据生命周期内管理数据的功能。设置 S3 生命周期策略之后,无需更改您的应用程序,您的数据将自动传输到其他存储类。 S3 目录存储桶仅允许存储在 S3 Express One Zone 存储类中的对象,该存储类可在单个可用区内实现更快的数据处理,并且不支持 S3 生命周期策略。

查看 Amazon S3 存储类概览信息图。

通用

S3 标准针对频繁访问的数据,提供持久性、可用性和性能较高的对象存储。由于 S3 标准可交付低延迟的高吞吐量,因此适合广泛使用案例,包括云应用程序、动态网站、内容分配、移动和游戏应用程序以及大数据分析。 

主要特征:

  • 用于对经常访问的数据进行通用存储
  • 较低的延迟和较高的吞吐量性能
  • 旨在提供 99.99% 的可用性,可用性 SLA 为 99.9%

未知或变化的访问

Amazon S3 Intelligent-Tiering (S3 Intelligent-Tiering) 是首个云存储,它可以根据访问频率自动将数据移至最经济实惠的访问层,从而自动在细粒度对象级别降低您的存储成本,并且不会产生性能影响、检索费用或运营开销。S3 Intelligent-Tiering 可以为频繁、不频繁和归档即时访问层中的频繁、不频繁以及很少访问的数据提供毫秒级延迟和提高吞吐量性能。您可以通过虚拟方式将 S3 Intelligent-Tiering 用作任何工作负载(尤其是数据湖、数据分析、新应用程序和用户生成的内容)的默认存储类。

每月只需支付少量的对象监控和自动化费用,S3 Intelligent-Tiering 即可监控访问模式并将未访问的对象自动移动到较低成本访问层。S3 Intelligent-Tiering 自动将对象存储在三个访问层中:一个针对频繁访问进行了优化的层,一个针对不频繁访问进行了优化且成本降低 40% 的层,以及一个针对很少访问的数据优化且成本降低 68% 的层。S3 Intelligent-Tiering 可监控访问模式,并将连续 30 天未访问的对象移动到不频繁访问层,并在 90 天未访问之后,移动到归档即时访问层。对于不需要即时检索的数据,您可以设置 S3 Intelligent-Tiering,以监控对象并在 180 天以上未访问后将其则移至深度归档访问层,从而实现高达 95% 的存储成本节省。

S3 Intelligent-Tiering 没有检索费用。如果之后访问了不频繁归档即时访问层中的对象,则其会被自动移回频繁访问层。如果您正在检索的对象存储在可选的深度归档层中,在您可以检索对象之前,您必须先使用 RestoreObject 恢复副本。 有关恢复存档对象的信息,请参阅恢复存档对象。 在 S3 Intelligent-Tiering 存储类中的访问层之间移动对象时,不会产生额外的分层费用。

主要特征:

  • 适用于访问模式未知或不断变化的数据,可自动成本节省
  • 频繁、不频繁和归档即时访问层具有与 S3 Standard 相同的低延迟和高吞吐量性能
  • 不频繁访问层最多可节省 40% 的存储成本
  • 归档即时访问层可节省高达 68% 的存储成本
  • 适用于很少访问的对象的可选自动异步归档功能
  • 深度归档访问层的性能与 Glacier Deep Archive 相同,且最高能为很少访问的对象节省 95% 的成本
  • 旨在提供 99.9% 的可用性,可用性 SLA 为 99%
  • 每月支付少量的监控和自动化费用
  • 无运营开销、生命周期费用和检索费用,也无最低存储持续时间
  • 小于 128KB 的对象也可以存储在 S3 Intelligent-Tiering 中,但将始终按频繁访问层费率收费,不收取监控和自动化费用。

高性能

Amazon S3 Express One Zone 存储类 是一款高性能的专用单可用区存储类,可为您经常访问的数据和延迟敏感型应用程序提供稳定的毫秒级数据访问性能。 与 S3 Standard 相比,S3 Express One Zone 可以将数据访问速度提高 10 倍,将请求成本降低 50%。虽然您始终可以选择特定的 AWS 区域来存储 S3 数据,而借助 S3 Express One Zone,您可以指定一个 AWS 区域中的特定 AWS 可用区来存储数据。您可以选择将存储与计算资源并置在同一可用区内,以便进一步优化性能,这有助于降低计算成本,提高工作负载的运行速度。使用 S3 Express One Zone,数据将存储在 Amazon S3 目录存储桶(这是另一种存储桶类型)中,可支持每秒数十万个请求。此外,您可以将 S3 Express One Zone 与 Amazon SageMaker 模型训练Amazon AthenaAmazon EMRAWS Glue Data Catalog 等服务结合使用,从而加速机器学习和分析工作负载。借助 S3 Express One Zone,存储可根据您的使用情况和需求自动纵向扩展或缩减,您无需再为低延迟工作负载管理多个存储系统。

主要特征:

  • 高性能存储,可存储您最频繁访问的数据
  • 请求延迟稳定在仅几毫秒
  • 与 S3 Standard 相比,访问速度提高了 10 倍,请求成本降低了 50%
  • 选择一个 AWS 可用区,可以选择将存储和计算资源放在同一个位置以减少延迟,同时缩短处理时间和提高计算资源的使用效率,从而降低总体拥有成本
  • 利用 AWS 服务集成加快分析和 ML 工作负载
  • 扩展到每分钟处理数百万条请求
  • 针对包含许多小对象的大型数据集进行了优化
  • 使用具有不同存储桶类型(目录存储桶)的现有 Amazon S3 API
  • 旨在提供 99.95% 的可用性,可用性 SLA 为 99.9%

不频繁访问

S3 Standard-IA 适用于不常访问、但在需要时要求快速访问的数据。S3 Standard-IA 提供较高的持久性、较高的吞吐量以及较低的 S3 Standard 延迟,并且每 GB 的存储价格和检索费用都较低。成本较低且性能出色使得 S3 Standard-IA 成为长期存储和备份的理想选择,也非常适用于灾难恢复文件的数据存储。您可以在对象级别配置 S3 存储类,单一存储桶可包含跨 S3 Standard、S3 Intelligent-Tiering、S3 Standard-IA 和 S3 One Zone-IA 存储的对象。您还可使用 S3 生命周期策略在存储类之间自动转移对象,而无需更改任何应用程序。

主要特征:

  • 需要毫秒级访问的不经常访问的数据
  • 和 S3 Standard 相同的较低延迟和较高吞吐量性能
  • 旨在提供 99.9% 的可用性,可用性 SLA 为 99%

S3 单区 - IA 适用于不常访问、但在需要时要求快速访问的数据。其他 S3 存储类将数据存储在至少三个可用区 (AZ) 中,而 S3 单区 - IA 将数据存储在单个 AZ 中并且成本较 S3 标准 - IA 低 20%。S3 单区 - IA 非常适合希望针对不频繁访问的数据使用较低费用选项且不需要 S3 标准或 S3 标准 - IA 的可用性和弹性的客户。对于存储本地数据或可轻松重新创建的数据的辅助备份副本,它是一个理想的选择。对于使用 S3 跨区域复制从另一 AWS 区域复制的数据,您还可使用它作为经济高效的存储。

S3 One Zone-IA 提供相同的较高吞吐量以及较低的 S3 Standard 延迟,并且每 GB 的存储价格和检索费用都较低。S3 One Zone-IA 使用与 S3 区域存储类相似的工程设计,还提供 11 个 9 的持久性,但在 AWS 可用区全部或部分丢失或损坏的情况下,很可能容易丢失数据。您可以在对象级别配置 S3 存储类,单一存储桶可包含跨 S3 Standard、S3 Intelligent-Tiering、S3 Standard-IA 和 S3 One Zone-IA 存储的对象。您还可使用 S3 生命周期策略在存储类之间自动转移对象,而无需更改任何应用程序。

主要特征:

  • 可重新创建的不经常访问的数据
  • 和 S3 Standard 相同的较低延迟和较高吞吐量性能
  • 旨在提供 99.5% 的可用性,可用性 SLA 为 99%

存档

Amazon S3 Glacier 存储类专为数据归档而构建,旨在为您提供具有最高性能、最大检索灵活性和最低成本的云归档存储。您可以从针对不同访问模式和存储持续时间优化的三种归档存储类中进行选择。对于需要即时访问的归档数据,例如医学图像、新闻媒体资产或基因组学数据,请选择 S3 Glacier Instant Retrieval 存储类,这种归档存储类可提供最低的存储成本及毫秒级检索速度。对于不需要立即访问但需要灵活地免费检索大量数据的归档数据,例如备份或灾难恢复使用案例,请选择 S3 Glacier 灵活检索(以前称为 S3 Glacier),它可在几分钟内检索,也可以在 5—12 小时内进行免费批量检索。要使长期归档存储(例如合规性归档和数字媒体保留)实现更大的成本节省,请选择 S3 Glacier Deep Archive,这是成本最低的云存储,数据检索时间为 12—48 小时。

Amazon S3 Glacier Instant Retrieval 是一种归档存储类,可以为很少访问且需要毫秒级检索速度的长期数据提供最低成本的存储。如果您每季度访问一次数据,则与 S3 Standard-Infrequent Access (S3 Standard-IA) 存储类相比,S3 Glacier 即时检索可为您节省高达 68% 的存储成本。S3 Glacier 即时检索可提供对归档存储的最快访问,并且与 S3 Standard 和 S3 Standard-IA 存储类具有相同的吞吐量和毫秒级访问速度。S3 Glacier 即时检索非常适合需要立即访问的归档数据,例如医学图像、新闻媒体资产或用户生成的内容归档。您可以将对象直接上传到 S3 Glacier Instant Retrieval,或使用 S3 生命周期策略从 S3 存储类传输数据。如需更多信息,请访问 Amazon S3 Glacier Instant Retrieval 页面 »

主要特征:

  • 每年通过即时检索访问几次的长期数据
  • 毫秒级数据检索,S3 Standard 同等性能
  • 旨在提供 99.9% 的可用性,可用性 SLA 为 99%
  • 128 KB 最低对象大小
  • 用于直接上传到 S3 Glacier Instant Retrieval 的 S3 PUT API,以及用于自动迁移对象的 S3 生命周期管理

S3 Glacier Flexible Retrieval 为每年访问 1—2 次且异步检索的归档数据提供低成本存储,成本最多降低 10%(相比 S3 Glacier Instant Retrieval)。对于不需要立即访问但需要灵活地免费检索大量数据的归档数据,例如备份或灾难恢复使用案例,S3 Glacier Flexible Retrieval(以前称为 S3 Glacier)是理想的存储类。S3 Glacier 灵活检索提供最灵活的检索选项,可以平衡成本与访问时间(从几分钟到几小时不等),并且可批量检索。它是备份、灾难恢复、离线数据存储需求的理想解决方案,并且还非常适合于偶尔需要在几分中内检索部分数据而您不想担心成本的情况。通过跨多个物理分离的 AWS 可用区冗余存储数据,S3 Glacier Flexible Retrieval 旨在实现 99.999999999%(11 个 9)的数据持久性和 99.99% 的可用性。有关更多信息,请访问 Amazon S3 Glacier 存储类页面 »

主要特征:

  • 备份和存档很少访问且成本低廉的数据
  • 旨在提供 99.99% 的可用性,可用性 SLA 为 99.9%
  • 支持传输中数据 SSL 和静态数据加密
  • 非常适合需要在几分钟内偶尔检索大量数据而无需担心成本的备份、灾难恢复用例
  • 检索时间可配置,从数分钟到数小时不等,并可免费批量检索
  • 用于直接上传到 S3 Glacier Flexible Retrieval 的 S3 PUT API,以及用于自动迁移对象的 S3 生命周期管理

S3 Glacier Deep Archive 是 Amazon S3 成本最低的存储类,支持每年可能访问一两次的数据的长期保留和数字预留。它是为客户设计的 – 特别是那些监管严格的行业,如金融服务、医疗保健和公共部门 – 为了满足监管合规要求,将数据集保留 7—10 年或更长时间。S3 Glacier Deep Archive 还可用于备份和灾难恢复使用案例,是成本效益高、易于管理的磁带系统替代,无论磁带系统是本地库还是非本地服务都是如此。S3 Glacier Deep Archive 是 Amazon S3 Glacier 的补充,后者适合存档,其中会定期检索数据并且每隔几分钟可能需要一些数据。存储在 S3 Glacier Deep Archive 中的所有对象都将接受复制并存储在至少三个地理分散的可用区中,受 99.999999999% 的持久性保护,并且可在 12 小时内恢复。 有关更多信息,请访问 Amazon S3 Glacier 存储类页面 »

主要特征:

  • 存档非常少访问且成本非常低的数据
  • 旨在提供 99.99% 的可用性,可用性 SLA 为 99.9%
  • 磁带库的完美替代
  • 检索时间为 12 小时以内
  • 用于直接上传到 S3 Glacier Deep Archive 的 S3 PUT API,以及用于对象自动迁移的 S3 生命周期管理

S3 on Outposts

Amazon S3 on Outposts 可向本地 AWS Outposts 环境提供对象存储。使用目前在 AWS 区域中可用的 S3 API 和功能,S3 on Outposts 可让您在 Outpost 上轻松地存储和检索数据,并保护数据的安全、控制访问、进行标签和对数据进行报告。S3 on Outposts 提供了一个名为“OUTPOSTS”的 Amazon S3 存储类;该存储类使用 S3 API,并且用于在 Outposts 上的多个设备和服务器之间持久且冗余地存储数据。S3 Outposts 存储类适用于具有本地数据驻留要求的工作负载,还可以通过让数据靠近本地应用程序来满足苛刻的性能需求。

主要特征:

  • 通过 S3 开发工具包进行 S3 对象兼容性和存储桶管理
  • 旨在以冗余方式持久地将数据存储在您的 Outposts 中
  • 使用 SSE-S3 和 SSE-C 进行加密
  • 使用 IAM 和 S3 接入点进行身份验证和授权
  • 使用 AWS DataSync 将数据传输到 AWS 区域
  • S3 生命周期过期操作

跨 S3 存储类的性能

  S3 Standard S3 Intelligent-Tiering*
S3 Express One Zone** S3 Standard-IA
S3 One Zone-IA**
S3 Glacier
Instant Retrieval
S3 Glacier Flexible Retrieval*** S3 Glacier
Deep Archive***
使用案例 用于对经常访问的数据进行通用存储 适用于访问模式未知或不断变化的数据,可自动成本节省 高性能存储,可存储您最频繁访问的数据 需要毫秒级访问的不经常访问的数据 可重新创建的不经常访问的数据 每年通过即时检索访问几次的长期数据 备份和存档很少访问且成本低廉的数据 存档非常少访问且成本非常低的数据
首字节延迟 毫秒 毫秒 几毫秒 毫秒 毫秒 毫秒 分钟或小时 小时
持久性
Amazon S3 提供最持久的云端存储。基于其独特的架构,S3 的数据持久性设计为超过 99.999999999%(11 个 9)。此外,默认情况下,S3 至少跨 3 个可用区冗余存储数据,其内置弹性可应对大范围灾难。客户可以将数据存储在单个可用分区中以最大限度地降低存储成本或延迟,也可以将数据存储在多个可用分区中以防止整个数据中心永久丢失,或者将数据存储在多个 AWS 区域中以满足地理弹性要求。
设计可实现可用性
99.99% 99.9% 99.95% 99.9% 99.5% 99.9% 99.99% 99.99%
可用性 SLA 99.9% 99% 99.9% 99% 99% 99%
99.9% 99.9%
可用区 ≥3 ≥3 1 ≥3 1 ≥3 ≥3 ≥3
最低存储持续时间费用 不适用 不适用 1 小时 30 天 30 天 90 天 90 天 180 天
检索费用 不适用
不适用
不适用 每检索 1GB
每检索 1GB 每检索 1GB 每检索 1GB 每检索 1GB
生命周期转换

* S3 Intelligent-Tiering 收取小额监控和自动化费用,对自动分层有 128KB 的最小合格对象大小限制。更小的对象也可以存储,但将始终按频繁访问层费率收费,不收取监控和自动化费用。有关更多信息,请参阅 Amazon S3 定价。 存档访问层和深度存档访问层中的标准检索是免费的。如果您需要从存档访问层中更快地访问您的对象,您可以使用 S3 控制台为加快的检索付费。S3 智能分层频繁和不频繁访问层的首字节延迟为毫秒访问时间,存档访问和深度存档访问层的首字节延迟为分钟或小时。

** 当发生 AWS 可用区全部或部分丢失或损坏的极少数情况下,One Zone 存储类中的数据可能会丢失。例如,火灾和水灾等事件可能导致数据丢失。除了这些类型的事件外,我们的 One Zone 存储类使用与区域存储类相似的工程设计来保护对象免受独立磁盘、主机和机架级故障的影响,并且每种类型都被设计为提供 99.999999999% 的数据持久性。

S3 Glacier Flexible Retrieval 和 S3 Glacier Deep Archive 还需要额外为每个存储对象提供 40 KB 元数据,其中包括按 S3 Glacier Flexible Retrieval 费率收费的识别和检索数据所需的 32 KB 元数据。另外 8 KB 数据按 S3 Standard 费率收费,这是维护归档到 S3 Glacier Flexible Retrieval 的对象的自定义名称和元数据所必需的数据。