Amazon DocumentDB(兼容 MongoDB)文档
Amazon DocumentDB(兼容 MongoDB)是一项文档数据库服务,专为大规模管理 JSON 数据而设计。这项可扩展的服务为客户在运行 MongoDB 工作负载时提供了持久性。在 Amazon DocumentDB 中,存储容量在基于实例的集群中可自动扩展至 128 TiB,在 Amazon DocumentDB 弹性集群中可自动扩展至 4 PiB。Amazon DocumentDB 能够支持每秒数以百万计的请求,数分钟内最高可处理 15 个低延迟只读副本。Amazon DocumentDB 旨在实现 99.9% 的服务水平协议(SLA)。该服务旨在使您的数据在一个区域内的三个可用区(AZ)以及另一个可用区中的额外并行存储节点上持久耐用。通过六种方式复制新写入内容。Amazon DocumentDB 旨在弹性应对区域内的故障和数据丢失失效转移。客户可以使用 AWS Database Migration Service(DMS),将自我管理型 MongoDB 数据库迁移到 Amazon DocumentDB。
规模性能
Amazon DocumentDB Elastic Clusters:通过 Amazon DocumentDB Elastic Clusters,客户每秒能够处理数百万次读写操作,从而让客户能够快速扩展其文档数据库。客户还可以存储 PB 级的数据。
高吞吐量、低延迟的文档查询:Amazon DocumentDB 具有 JSON 文档模型、数据类型和索引。该服务使用纵向扩展、内存优化架构,旨在实现对大型文档集进行快速查询评估。
数据库计算资源扩展:通过 AWS 管理控制台,客户可创建所需大小的新副本实例或删除实例,扩展或缩减计算和内存资源。计算扩展操作可快速完成。
可扩展的存储:Amazon DocumentDB 会随着您集群存储需求的增长而提高您的存储卷大小。存储卷将以 10 GB 的增量增加,最大可增加到 4 PiB。这种设计的目的是,客户无需为了满足未来增长需求,而为文档数据库预置多余存储空间。
低延迟只读副本:通过创建多达 15 个数据库只读副本,增加读取吞吐量以支持大量应用程序请求。Amazon DocumentDB 副本与源实例共享同一个底层存储。此功能旨在释放更多处理能力来处理读取请求并减少副本延迟时间。Amazon DocumentDB 还旨在为读取查询提供单个端点,因此,应用程序不必在添加和删除副本时对这些副本进行跟踪,即可建立连接。
兼容 MongoDB
Amazon DocumentDB 兼容 MongoDB 3.6、4.0 和 5.0 驱动程序和工具。客户现已用于开源 MongoDB 非关系数据库的许多应用程序、驱动程序和工具都可与 Amazon DocumentDB 配合使用。Amazon DocumentDB 通过在专门构建的、具有容错和自我修复能力的分布式存储系统上实施 Apache 2.0 开源 MongoDB 3.6、4.0 和 5.0 API 来模拟客户端从 MongoDB 服务器获得的响应,该存储系统旨在为客户提供在大规模运行 MongoDB 工作负载时所需的性能、可扩展性和可用性。
地理空间查询功能:通过地理空间查询功能,客户可以使用 Amazon DocumentDB 支持存储、查询和索引地理空间数据。客户可以创建 2dsphere 索引并使用流行的 MongoDB 地理空间 API,例如 $nearSphere、$geoNear、$minDistance、$maxDistance 来对存储在 DocumentDB 中的数据执行查询。
ACID 事务:ACID(原子性、一致性、隔离性、持久性)是数据库事务的一组属性,旨在在出现错误、电源故障和其他事故的情况下保证数据的有效性。发布了对 MongoDB 4.0 兼容性的支持后,Amazon DocumentDB 支持跨多个文档、语句、集合和数据库执行 ACID 事务。
迁移支持:客户可以使用 AWS Database Migration Service(DMS),在最短的停机时间内,将其本地或 Amazon EC2 上的 MongoDB 数据库迁移到 Amazon DocumentDB。借助 DMS,客户可以从 MongoDB 副本集或从分片式集群迁移到 Amazon DocumentDB。
托管
预置和设置:使用 AWS 管理控制台启动新的 Amazon DocumentDB 集群,开始使用 Amazon DocumentDB。Amazon DocumentDB 实例为选择的实例类预配置了合适的参数和设置。客户可启动集群并连接应用程序,而无需进行其他配置。
监控和指标:Amazon DocumentDB 旨在为云数据库实例提供 Amazon CloudWatch 指标。客户可以使用 AWS 管理控制台查看适用于集群的 40 多个关键运营指标,其中包括计算、内存、存储、查询吞吐量、MongoDB 操作计数以及活动连接。
软件修补:Amazon DocumentDB 旨在使用最新的补丁让客户的数据库保持最新状态。客户可以通过数据库引擎版本管理来控制是否以及何时修补集群。
安全性
网络隔离:Amazon DocumentDB 在 Amazon Virtual Private Cloud(VPC)中运行,可帮助客户将集群隔离在虚拟网络中,并使用加密的 IPsec 虚拟专用网络(VPN)与本地 IT 基础设施连接。此外,使用 Amazon DocumentDB 的 VPC 配置,客户还可以配置防火墙设置并控制对集群的网络访问。
授权:Amazon DocumentDB 通过内置角色支持基于角色的访问控制(RBAC)。RBAC 可通过限制用户有权执行的操作,帮助客户强制执行最低权限。Amazon DocumentDB 与 AWS Identity and Access Management(IAM)集成,并可帮助客户控制 AWS IAM 用户和组可以对特定 Amazon DocumentDB 资源(包括集群、实例、快照和参数组)执行的操作。此外,客户还可以为 Amazon DocumentDB 资源添加标签,并控制 IAM 用户和组可以对各组具有相同标签(和标签值)的资源执行的操作。
加密:借助 Amazon DocumentDB,客户可以使用通过 AWS Key Management Service(KMS)创建和控制的密钥来加密数据库。在通过 Amazon DocumentDB 加密运行的集群上,静态存储于底层存储中的数据都经过加密,同一集群中的自动备份、快照和副本也是如此。默认情况下,客户端与 Amazon DocumentDB 之间的连接使用 TLS 进行了动态加密。
可用性
全局集群:Amazon DocumentDB 全局集群旨在提供在发生区域级故障时进行灾难恢复的能力,并支持低延迟全局读取。Amazon DocumentDB 全局集群可将数据复制到最多 5 个 AWS 区域的集群中,且对性能的影响极小。
实例监控和修复:持续监控每个 Amazon DocumentDB 集群及其实例的运行状况。如果支持数据库的实例发生故障,该实例和相关进程会自动重启。执行 Amazon DocumentDB 恢复不需要重放数据库重做日志(重放可能会花很长时间),因此实例重启速度会较快。它还会将数据库缓存与数据库进程隔离开来,这样缓存在数据库重启时就不会丢失了。
使用只读副本的多可用区部署:如果出现实例故障,Amazon DocumentDB 旨在自动失效转移到在三个可用区的任意一个中创建的多达 15 个 Amazon DocumentDB 副本中的一个。如果未预置任何 Amazon DocumentDB 副本,在发生故障的情况下,Amazon DocumentDB 将尝试为客户创建新实例。
容错存储:存储卷的每个 10 GB 部分都能跨三个可用区(AZ)以六种方法进行复制。Amazon DocumentDB 使用的存储旨在以透明方式应对多达两个数据副本丢失的情况,而不会影响数据库写入可用性,还能在不影响读取可用性的情况下应对多达三个副本丢失的情况。可连续扫描 Amazon DocumentDB 的存储数据块和磁盘有无出错并予以更换。
持续、增量备份和时间点恢复:Amazon DocumentDB 的简单数据库备份功能支持对集群进行时间点恢复。这旨在让客户可以将集群还原到保留期内的任何一秒,最多可以还原到五分钟前的状态。备份保留期最长可配置为三十五天。自动备份存储在 Amazon Simple Storage Service(S3)中,该服务专为实现极高的持久性而设计。Amazon DocumentDB 备份是自动、增量且连续的,对集群性能几乎没有影响。
集群快照:集群快照是用户对存储在 Amazon S3 中的集群发起的备份,将保留到明确删除它们为止。它们利用增量快照减少所需时间和存储。客户可以在需要时随时从集群快照创建新集群。
生成式人工智能和机器学习:Amazon DocumentDB 提供的功能使机器学习(ML)和生成式人工智能(AI)模型能够实时处理存储在 Amazon DocumentDB 中的数据。这些功能旨在帮助减少客户在管理单独的基础设施、编写连接其他服务的代码,以及从其主要数据库复制数据方面所花费的时间。
向量搜索:借助 Amazon DocumentDB 的向量搜索,客户能以快速的响应时间对向量进行存储、索引编制和搜索。向量是一种数字表示法,表示文本、图像和视频等非结构化数据的语义含义。客户可以存储来自 Amazon Bedrock、Amazon SageMaker 和其他第三方或专有模型的向量。
使用 Amazon DocumentDB 和 Amazon SageMaker Canvas 进行无代码机器学习:Amazon DocumentDB 与 Amazon SageMaker Canvas 集成,让客户可以使用存储在 Amazon DocumentDB 中的数据构建生成式应用程序。控制台内集成旨在通过低代码无代码(LCNC)体验帮助客户加速人工智能/机器学习开发。
客户可以为经典使用案例构建人工智能/机器学习模型,或在 SageMaker Canvas 中创建生成式人工智能解决方案。
零 ETL 集成:Amazon DocumentDB 与 Amazon OpenSearch Service 的零 ETL 集成使用 OpenSearch API,在 Amazon DocumentDB 文档上提供高级搜索功能。这种零 ETL 集成使用 Amazon OpenSearch Ingestion,将文档数据从 Amazon DocumentDB 移动到 Amazon OpenSearch Service。
其他信息
有关服务控制、安全特征和功能的更多信息,包括有关存储、检索、修改、限制和删除数据的信息(如适用),请参阅 https://docs.aws.amazon.com/index.html。对于 http://aws.amazon.com/agreement 上的《AWS 客户协议》或者您与 AWS 之间签订的用于管理您使用 AWS 服务的其他协议而言,这些其他信息并不构成此文档的一部分。