- Bases de datos›
- Amazon DocumentDB›
- Preguntas frecuentes
Preguntas frecuentes sobre Amazon DocumentDB (compatible con MongoDB)
Aspectos generales
Abrir todoAmazon DocumentDB es un servicio de bases de datos de documentos sin servidor, completamente administrado y compatible con la API de MongoDB. Se deshace de la carga operativa que suponen las tareas de administración de bases de datos, como aplicar parches, realizar copias de seguridad y supervisar el sistema. Amazon DocumentDB ofrece alta resiliencia y baja latencia mediante clústeres globales, junto con seguridad y cumplimiento de primer nivel, diseñados para satisfacer las necesidades de organizaciones con requisitos estrictos, como bancos globales. Proporciona un bajo costo total de propiedad (TCO), con precios transparentes y sin tarifas ocultas. Las instancias optimizadas para memoria pueden ofrecer hasta un 43 % de ahorro en comparación con otras bases de datos de documentos ampliamente utilizadas. La opción de optimización para operaciones de E/S mejora la relación precio-rendimiento y puede generar hasta un 40 % de ahorro para aplicaciones intensivas en operaciones de E/S. Además, Amazon DocumentDB es compatible con las API y los controladores de MongoDB, por lo que es posible migrar aplicaciones sin cambios en el código ni interrupciones por lo general.
Las bases de datos de documentos son una de las categorías de bases de datos NoSQL de crecimiento más rápido, ya que ofrecen esquemas flexibles y amplias capacidades de consulta. El modelo de documentos es una excelente opción para casos de uso con conjuntos de datos dinámicos que requieren consultas ad hoc, indexación y agregaciones. Debido a la escala que ofrece Amazon DocumentDB, lo utilizan una amplia variedad de clientes para casos de uso como la administración de contenido, la personalización, los catálogos, las aplicaciones móviles y web, el IoT, la búsqueda semántica y la administración de perfiles de usuario.
“La compatibilidad con MongoDB” significa que Amazon DocumentDB interactúa con las API de MongoDB de código abierto bajo la licencia Apache 2.0. Como resultado, puede usar los mismos controladores, aplicaciones y herramientas de MongoDB con Amazon DocumentDB con pocos o ningún cambio. Aunque Amazon DocumentDB es compatible con la gran mayoría de las API de MongoDB que los clientes utilizan, no es compatible con todas las API de MongoDB. Nuestro enfoque es ofrecer las capacidades que los clientes necesitan.
Trabajamos en función de las necesidades del cliente y ofrecemos capacidades como la compatibilidad con las API de MongoDB, las transacciones y el particionamiento. Para obtener más información sobre las API de MongoDB compatibles, consulte nuestra documentación de compatibilidad. Para conocer los lanzamientos recientes de Amazon DocumentDB, consulte nuestra Fuente de novedades.
Amazon DocumentDB 8.0 ofrece compatibilidad con MongoDB 8.0 al incorporar compatibilidad con los controladores de la API de MongoDB 8.0. Puede migrar cargas de trabajo que se ejecutan en MongoDB 6.0, 7.0 y 8.0 a Amazon DocumentDB 8.0. Puede utilizar controladores, herramientas y código de aplicación existentes de MongoDB con Amazon DocumentDB 8.0.
En el caso de las aplicaciones basadas en MongoDB 3.6, 4.0 y 5.0, Amazon DocumentDB continúa admitiendo estas API en sus versiones correspondientes (Amazon DocumentDB 3.6, 4.0 y 5.0).
No. Amazon DocumentDB no utiliza ningún código SSPL de MongoDB y, por lo tanto, no se encuentra restringido por esta licencia. En su lugar, Amazon DocumentDB interactúa con las API de MongoDB de código abierto bajo la licencia Apache 2.0. Siempre escuchamos y trabajamos con nuestros clientes como punto de partida para ofrecer las capacidades que necesitan. Para obtener más información acerca de las API de MongoDB admitidas, consulte la documentación sobre compatibilidad.
Los clientes pueden usar AWS Database Migration Service (DMS) para migrar las bases de datos de MongoDB en las instalaciones o en Amazon Elastic Compute Cloud (EC2) a Amazon DocumentDB prácticamente sin tiempo de inactividad. Con DMS, puede migrar desde un conjunto de réplicas de MongoDB o desde un clúster con particionamiento hacia Amazon DocumentDB. Además, puede usar la mayoría de las herramientas existentes para migrar datos desde una base de datos de MongoDB a Amazon DocumentDB, incluidas mongodump/mongorestore, mongoexport/mongoimport, así como herramientas de terceros que admiten la captura de cambios de datos (CDC) mediante el oplog. Para obtener más información, consulte Migración a Amazon DocumentDB.
No. Amazon DocumentDB funciona con la gran mayoría de las API, los controladores y las herramientas de MongoDB que son compatibles con las versiones 3.6, 4.0 y 5.0 de MongoDB.
Sí. Con el lanzamiento de la compatibilidad con MongoDB 4.0, Amazon DocumentDB admite la capacidad de ejecutar transacciones de atomicidad, coherencia, aislamiento y durabilidad (ACID) en varios documentos, instrucciones, colecciones y bases de datos. Para obtener más información, consulte nuestra documentación Transacciones en Amazon DocumentDB.
No. Amazon DocumentDB no sigue los mismos ciclos de soporte que MongoDB, y el cronograma de fin de vida útil (EOL) de MongoDB no aplica a Amazon DocumentDB.
Las instancias de Amazon DocumentDB se implementan dentro de la Amazon Virtual Private Cloud (Amazon VPC) del cliente y pueden ser accesibles directamente por instancias de Amazon Elastic Compute Cloud (Amazon EC2) u otros servicios de AWS que estén implementados en la misma VPC. Además, es posible obtener acceso a Amazon DocumentDB mediante instancias de Amazon EC2 u otros servicios de AWS en diferentes VPC de la misma región u otras regiones a través de la conexión de emparejamiento de VPC. El acceso a las instancias de Amazon DocumentDB se debe realizar a través del shell de Mongo o de los controladores de MongoDB. Amazon DocumentDB pide que se autentique al momento de conectarse a un clúster. Para opciones adicionales, consulte Conexión a una instancia de Amazon DocumentDB desde fuera de una Amazon VPC.
Para ciertas características de administración, como la administración del ciclo de vida de las instancias, el cifrado en reposo con claves de Amazon Key Management Service (KMS) y la administración de grupos de seguridad, Amazon DocumentDB aprovecha la tecnología operativa que comparte con Amazon Relational Database Service (RDS) y Amazon Neptune. Al usar las API de la AWS CLI describe-db-instances y describe-db-clusters, se recomienda filtrar los recursos de Amazon DocumentDB con el siguiente parámetro: “--filter Name=engine,Values=docdb”.
Consulte nuestra página de precios de Amazon DocumentDB para obtener información actualizada sobre los tipos de instancias disponibles por región.
Para probar Amazon DocumentDB, consulte la guía de Introducción.
Sí. Amazon DocumentDB ofrece un acuerdo de nivel de servicio (SLA) del 99,99 % de tiempo de actividad, el cual se aplica por separado a cada cuenta que utilice Amazon DocumentDB. Si desea obtener más información, consulte el Acuerdo de nivel de servicios de Amazon DocumentDB (compatible con MongoDB).
El proyecto DocumentDB de código abierto, bajo la supervisión de la Fundación Linux, tiene como objetivo proporcionar a la comunidad de desarrolladores una base de datos de documentos basada en PostgreSQL y 100 % compatible con la API de MongoDB. En agosto de 2025, AWS anunció que se une a este proyecto como miembro del comité técnico directivo.
Aunque tanto DocumentDB de código abierto como Amazon DocumentDB utilizan el nombre DocumentDB y son compatibles con la API de MongoDB, se trata de software diferentes. Mientras que Amazon DocumentDB está desarrollado por completo por AWS, DocumentDB de código abierto se basa en PostgreSQL como una extensión. AWS continuará sus inversiones tanto en Amazon DocumentDB como en DocumentDB de código abierto, de manera similar a cómo invertimos en Amazon OpenSearch Service y en OpenSearch. Contribuiremos innovaciones de Amazon DocumentDB al proyecto de código abierto y adoptaremos características y capacidades de DocumentDB de código abierto en nuestro servicio administrado Amazon DocumentDB.
Tecnologías sin servidor
Abrir todoAmazon DocumentDB sin servidor es una configuración de escalado automático bajo demanda para Amazon DocumentDB. Escala o desescala verticalmente la capacidad automáticamente en incrementos detallados según la demanda de la aplicación, lo que ofrece hasta un 90 % de ahorro en costos en comparación con aprovisionar para la capacidad máxima. Para las aplicaciones con cargas de trabajo variables, Amazon DocumentDB sin servidor ofrece una administración de recursos simplificada, sin compromisos iniciales ni costos adicionales, por lo que solo paga por la capacidad de la base de datos utilizada. Amazon DocumentDB sin servidor proporciona las mismas API compatibles con MongoDB y las mismas capacidades que Amazon DocumentDB, incluidas las réplicas de lectura, Información sobre el rendimiento y el almacenamiento optimizado para E/S.
Con Amazon DocumentDB sin servidor, crea una base de datos, especifica el intervalo deseado de capacidad de la base de datos y conecta la aplicación. Amazon DocumentDB ajusta automáticamente la capacidad dentro del intervalo especificado según las necesidades de la aplicación. Se facturará por segundo por la capacidad de base de datos que utilice cuando la base de datos esté activa.
Amazon DocumentDB sin servidor está disponible a partir de Amazon DocumentDB 5.0 tanto para clústeres nuevos como para clústeres existentes. Amazon DocumentDB 8.0 no admite actualmente el modo sin servidor.
Sí, puede cambiar entre el modo sin servidor y recursos de base de datos aprovisionados en cualquier momento. Antes de cambiar entre el modo sin servidor y recursos aprovisionados, es importante asegurarse de que la carga de trabajo mantenga un rendimiento adecuado. Para probar la configuración deseada, clone el clúster de DocumentDB. Luego, aplique la configuración en el clúster clonado para realizar pruebas antes de aplicar los mismos cambios en el entorno de producción. También puede revertir fácilmente a una configuración anterior en cualquier momento.
Sí. Puede establecer la capacidad explícitamente en un valor específico mediante la Consola de administración de AWS, la AWS CLI o la API de Amazon DocumentDB.
Sí. Puede empezar a usar Amazon DocumentDB sin servidor para administrar la capacidad de computación de base de datos en la instancia existente de Amazon DocumentDB. Un clúster que contenga tanto instancias aprovisionadas como Amazon DocumentDB sin servidor se denomina clúster de configuración mixta. Puede elegir cualquier combinación de instancias aprovisionadas y Amazon DocumentDB sin servidor en el clúster.
Amazon DocumentDB sin servidor admite las mismas API compatibles con MongoDB y las mismas capacidades que Amazon DocumentDB, incluidas las transacciones, las zonas de disponibilidad de AWS e Información sobre el rendimiento. No admite Clústeres elásticos.
En Amazon DocumentDB sin servidor, la capacidad de base de datos se mide en unidades de capacidad de Amazon DocumentDB (DCU). Se cobra una tarifa fija por segundo de uso de DCU. Los costos de computación por ejecutar las cargas de trabajo en Amazon DocumentDB sin servidor dependen de la configuración del clúster de base de datos que elija: Amazon DocumentDB estándar o Amazon DocumentDB optimizado para operaciones de E/S. Para obtener información actualizada sobre precios y disponibilidad regional, visite la página de precios de Amazon DocumentDB.
Rendimiento y escalado
Abrir todoAmazon DocumentDB está diseñado para ofrecer un rendimiento alto y predecible a escala. Para cargas de trabajo con mucha lectura, puede agregar hasta 15 réplicas de lectura que compartan el mismo almacenamiento subyacente, lo que evita la sobrecarga de escritura de las réplicas y ofrece un mayor rendimiento de lectura agregado, al tiempo que mantiene el retraso de la réplica, normalmente en milisegundos. Sus datos se replican en tres zonas de disponibilidad con una rápida conmutación por error para una recuperación rápida.
Amazon DocumentDB desescala horizontalmente en dos dimensiones: almacenamiento y computación. El almacenamiento de Amazon DocumentDB escala de forma automática desde 10 GB a 128 TiB en clústeres basados en instancias y hasta 4 PiB para Clústeres elásticos de Amazon DocumentDB. La capacidad de computación de Amazon DocumentDB se puede escalar verticalmente, mediante la creación de instancias de mayor tamaño, y horizontalmente (a fin de lograr un mayor nivel de rendimiento de lectura), mediante la incorporación de instancias de réplica adicionales al clúster.
El límite mínimo de almacenamiento es de 10 GiB. Según el uso del clúster, el almacenamiento de Amazon DocumentDB crecerá automáticamente hasta 128 TiB, en incrementos de 10 GiB, sin impacto en el rendimiento. Con Clústeres elásticos de Amazon DocumentDB, el almacenamiento crecerá automáticamente hasta 4 PiB, en incrementos de 10 GiB. En cualquier caso, no es necesario aprovisionar el almacenamiento por adelantado.
Precios
Abrir todoPara obtener información actual sobre los precios y la disponibilidad por región, consulte la página de precios de Amazon DocumentDB.
Sí. Puede probar Amazon DocumentDB de forma gratuita mediante un periodo de prueba de un mes. La organización recibe hasta 750 horas de uso de instancias t3.medium, 30 millones de operaciones de E/S, 5 GB de almacenamiento y 5 GB de almacenamiento de copia de seguridad. Una vez que expire el mes de prueba gratuito o el uso exceda la asignación gratuita, puede apagar el clúster para evitar cualquier cargo o mantenerlo en ejecución bajo nuestras tarifas estándar bajo demanda. Para obtener más información, consulte la página de prueba gratuita de DocumentDB.
Sí. Puede adquirir un Savings Plan para bases de datos para el uso de Amazon DocumentDB y reducir los costos hasta un 30 % cuando se compromete con una cantidad constante de uso durante un periodo de un año. Puede encontrar información adicional sobre el uso elegible en la página de precios de los Savings Plans para bases de datos.
Amazon DocumentDB optimizado para E/S es la opción ideal cuando necesita costos predecibles o tiene aplicaciones intensivas de E/S. Si espera que los costos de E/S superen el 25 % de los costos totales de base de datos de Amazon DocumentDB, esta opción ofrece una mejor relación precio-rendimiento. Consulte nuestra documentación de Amazon DocumentDB optimizado para E/S para obtener más información, incluido cómo empezar.
Puede cambiar los clústeres de bases de datos existentes una vez cada 30 días a Amazon DocumentDB optimizado para E/S. Puede volver a las configuraciones de almacenamiento estándar de Amazon DocumentDB en cualquier momento.
Sí, se siguen cobrando los cargos por las operaciones de E/S necesarias para replicar datos en las regiones. Amazon DocumentDB optimizado para E/S no cobra por las operaciones de E/S de lectura y escritura, lo cual es diferente de la replicación de datos. Consulte nuestra documentación de Amazon DocumentDB optimizado para E/S para obtener más información.
Clústeres elásticos
Abrir todoPuede crear un clúster de Clústeres Elásticos a través de la API de Amazon DocumentDB, el SDK, la CLI, CloudFormation (CFN) o la consola de AWS. Cuando aprovisiona su clúster, especifica cuántas particiones y cuántos recursos de computación por partición necesita su carga de trabajo. Una vez que ha creado el clúster, está preparado para empezar a beneficiarse de la escalabilidad elástica de Clústeres elásticos. Ahora, puede conectarse al clúster de Clústeres elásticos y leer o escribir datos desde su aplicación. Clústeres elásticos es elástico. Según las necesidades de su carga de trabajo, puede agregar o eliminar recursos de computación si modifica el recuento de particiones o el de recursos de computación por partición a través de la consola de AWS, la API, la CLI o el SDK. Los clústeres elásticos aprovisionarán y desaprovisionarán automáticamente la infraestructura subyacente y volverán a equilibrar los datos.
Clústeres elásticos utiliza la partición para particionar datos en el sistema de almacenamiento distribuido de Amazon DocumentDB. La partición, también denominada particionado, divide conjuntos de datos de gran tamaño en conjuntos pequeños en varios nodos, lo cual permite a los clientes escalar horizontalmente su base de datos más allá de los límites de escalado vertical de una única base de datos. Clústeres elásticos utiliza la división de computación y almacenamiento de Amazon DocumentDB. En lugar de volver a particionar las colecciones mediante la transferencia de pequeños fragmentos de datos entre nodos de computación, los clústeres elásticos pueden copiar los datos de manera eficiente dentro del sistema de almacenamiento distribuido.
Clústeres elásticos es compatible con el particionado basado en hash.
Con Clústeres elásticos, puede escalar o desescalar horizontalmente su carga de trabajo en Amazon DocumentDB y, por norma general, con poco o ningún tipo de periodo de inactividad ni impacto sobre el rendimiento, sin importar el tamaño de los datos. Una operación similar en MongoDB afectaría al rendimiento de la aplicación y tardaría horas o, en algunos casos, días. Clústeres elásticos también ofrece capacidades de administración diferenciadas, como copias de seguridad sin impacto y una restauración rápida a un momento dado, lo que permite a los clientes dedicar más tiempo a las aplicaciones en lugar de emplearlo en administrar la base de datos.
No, no necesita hacer ningún cambio en la aplicación para utilizar Clústeres elásticos.
No. En el corto plazo, puede usar AWS Database Migration Service (AWS DMS) para migrar datos desde un clúster de instancias existente de Amazon DocumentDB hacia un clúster de Clústeres elásticos.
La elección de una clave de partición óptima para Clústeres elásticos no difiere de la de otras bases de datos. Una buena clave de partición tiene dos características: alta frecuencia y alta cardinalidad. Por ejemplo, si su aplicación almacena user_orders (pedidos de usuarios) en DocumentDB, por lo general tendrá que recuperar los datos por usuario. De este modo, querrá que todos los pedidos relacionados con un usuario específico estén en una partición. En ese caso, user_id (ID de usuario) sería una buena clave de partición. Obtenga más información.
Clústeres elásticos se integra con otros servicios de AWS en la misma forma que DocumentDB lo hace en la actualidad. Primero, puede utilizar AWS Database Migration Service (DMS) para migrar desde MongoDB y otras bases de datos relacionales a Clústeres elásticos. Segundo, puede supervisar el estado y el rendimiento de los clústeres de Clústeres elásticos mediante Amazon CloudWatch. Tercero, puede configuración la autenticación y la autorización mediante usuarios y roles de AWS IAM y utilizar AWS VPC para conexiones de solo VPC seguras. Por último, puede utilizar AWS Glue para importar y exportar datos desde o hacia otros servicios de AWS, como S3, Redshift y OpenSearch.
Sí. Puede migrar sus cargas de trabajo particionadas de MongoDB existentes a Clústeres elásticos. Puede utilizar AWS Database Migration Service o herramientas de MongoDB nativas, como mongodump y mongorestore, para migrar su carga de trabajo de MongoDB a Clústeres elásticos. Clústeres elásticos también es compatible con las API de MongoDB de uso común, como shardCollection(), lo que brinda la flexibilidad de reutilizar las herramientas y scripts existentes con Amazon DocumentDB.
Copia de seguridad y restauración
Abrir todoLas copias de seguridad automáticas siempre están habilitadas en los clústeres de Amazon DocumentDB. Amazon DocumentDB habilita la recuperación a un momento dado para los clústeres. Puede ampliar el periodo de copia de seguridad para restauraciones a un momento dado hasta 35 días. Las copias de seguridad no afectan el rendimiento de la base de datos. Para obtener más información, consulte Copia de seguridad y restauración en Amazon DocumentDB.
Sí. Las instantáneas manuales se pueden retener durante más tiempo que las copias de seguridad y el rendimiento no se ve afectado cuando se realizan. Tenga en cuenta que para restablecer datos a partir de instantáneas de clústeres es necesario crear un clúster nuevo.
Amazon DocumentDB hace que sus datos duren automáticamente en tres zonas de disponibilidad (AZ) dentro de una región e intentará recuperar de forma automática su instancia en una AZ en buen estado sin pérdida de datos. En el improbable caso de que los datos no se encuentren disponibles en el almacenamiento de Amazon DocumentDB, puede restablecerlos a partir de una instantánea de clúster o llevar a cabo una operación de restablecimiento en un momento dado en un clúster nuevo. Tenga en cuenta que el momento más reciente restaurable para una operación de restauración a un momento dado puede estar hasta cinco minutos en el pasado.
Puede optar por crear una instantánea final al momento de eliminar la instancia. De ser así, puede usar esta instantánea para restablecer la instancia eliminada en un momento posterior. Amazon DocumentDB retiene la instantánea final creada por el usuario junto con todas las demás instantáneas creadas manualmente después de la eliminación de la instancia. Solo se retienen las instantáneas después de eliminar la instancia (es decir, las copias de seguridad automatizadas creadas para la restauración a un momento dado no se mantienen).
Puede optar por crear una instantánea final al momento de eliminar la instancia. De ser así, puede usar esta instantánea para restablecer la instancia eliminada en un momento posterior. Amazon DocumentDB retiene la instantánea final creada por el usuario junto con todas las demás instantáneas creadas manualmente después de la eliminación de la instancia. Solo se retienen las instantáneas después de eliminar la instancia (es decir, las copias de seguridad automatizadas creadas para la restauración a un momento dado no se mantienen).
Sí. Amazon DocumentDB permite crear instantáneas del clúster, que puede usar más adelante para restaurar un clúster. Puede compartir una instantánea con una cuenta distinta de AWS, y el propietario de la cuenta receptora puede usar la instantánea para restaurar un clúster que contenga los datos. Incluso puede elegir que las instantáneas sean públicas. Es decir, cualquiera podría restaurar un clúster que contenga los datos (públicos). Puede usar esta característica para compartir datos entre diferentes entornos (producción, desarrollo/pruebas, ensayos, etc.) que tengan cuentas distintas, así como también conservar copias de seguridad de todos los datos seguras en una cuenta independiente en caso de que alguna vez la cuenta principal de AWS resulte comprometida.
Compartir instantáneas entre cuentas no conlleva ningún cargo. Sin embargo, es posible que se cobre por las instantáneas, así como por cualquier clúster que restaure a partir de instantáneas compartidas.
No es posible compartir instantáneas de clústeres automáticas. Para compartir una instantánea automática, debe crear una copia de la instantánea de forma manual y compartirla.
No. Solo las cuentas ubicadas en la misma región que la cuenta que comparte las instantáneas de Amazon DocumentDB podrán obtener acceso a estas.
Sí. Puede compartir instantáneas de Amazon DocumentDB cifradas. El destinatario de la instantánea compartida debe tener acceso a la clave de KMS que se utilizó para cifrar la instantánea.
No. Las instantáneas de Amazon DocumentDB solo se pueden usar dentro del servicio.
Puede optar por crear una instantánea final al momento de eliminar el clúster. De ser así, puede usar esta instantánea para restablecer el clúster eliminado en un momento posterior. Amazon DocumentDB retiene esta instantánea final creada por el usuario junto con todas las demás instantáneas creadas manualmente después de que se elimina el clúster.
Resiliencia
Abrir todoAmazon DocumentDB divide automáticamente el volumen de almacenamiento en segmentos de 10 GB distribuidos en varios discos. Garantizamos la durabilidad de los datos distribuyéndolos en tres zonas de disponibilidad, y solo paga por una copia. Amazon DocumentDB es un servicio diseñado para administrar de manera transparente la pérdida de hasta dos copias de datos sin que ello afecte a la disponibilidad de escritura y de hasta tres copias sin que incida en la disponibilidad de lectura. El volumen de almacenamiento de Amazon DocumentDB también cuenta con recuperación automática. Los bloques de datos y los discos están sujetos a un análisis constante en busca de errores y se reparan automáticamente.
A diferencia de otras bases de datos, después de una caída, Amazon DocumentDB no necesita reproducir el registro de rehacer desde el último punto de control de la base de datos (normalmente cinco minutos) ni confirmar que todos los cambios se hayan aplicado antes de poner la base de datos disponible para las operaciones. Esto reduce el tiempo de reinicio de la base de datos a menos de 60 segundos en la mayoría de los casos. Amazon DocumentDB extrae la caché del proceso de la base de datos y la habilita inmediatamente en el momento de realizar el reinicio. Esto evita la necesidad de limitar el acceso hasta que la caché se vuelve a llenar a fin de evitar interrupciones.
Amazon DocumentDB admite réplicas de lectura, las cuales comparten el mismo volumen de almacenamiento subyacente que la instancia principal. Las actualizaciones realizadas por la instancia principal son visibles para todas las réplicas de Amazon DocumentDB. Puede configurar hasta 15 réplicas de lectura. La replicación es asíncrona y normalmente se completa en milisegundos, con un impacto mínimo en el rendimiento de la instancia principal. Para obtener más información, consulte Alta disponibilidad y replicación de Amazon DocumentDB.
Sí. Puede replicar los datos entre regiones mediante la característica Clústeres globales. Los clústeres globales abarcan varias regiones de AWS. Los clústeres globales replican los datos en clústeres en hasta cinco regiones con un impacto mínimo o nulo en el rendimiento. Los clústeres globales permiten una recuperación más rápida ante interrupciones que afecten a una región completa y habilitan lecturas globales de baja latencia. Para obtener más información, consulte la página de la característica Clústeres globales y la entrada del blog.
Sí. Puede asignar un nivel de prioridad de promoción a cada instancia del clúster. Si la instancia principal falla, Amazon DocumentDB promoverá a principal la réplica con la prioridad más alta. Si existen inconsistencias entre dos o más réplicas dentro del mismo nivel de prioridad, Amazon DocumentDB promoverá la réplica que tenga el mismo tamaño que la instancia principal.
Puede modificar el nivel de prioridad de una instancia en cualquier momento. Modificar los niveles de prioridad no desencadenará una conmutación por error.
Puede asignar niveles de prioridad inferiores a las réplicas que no quiera transformar en instancia principal. Sin embargo, si las réplicas de mayor prioridad del clúster no están en buen estado o no se encuentran disponibles por alguna razón, entonces Amazon DocumentDB promoverá la réplica de menor prioridad.
Es posible implementar Amazon DocumentDB en una configuración de alta disponibilidad mediante el uso de instancias de réplicas en varias zonas de disponibilidad de AWS como destinos de conmutación por error. En caso de que ocurra un error en la instancia principal, una instancia de réplica se transformará automáticamente en la nueva instancia principal con una interrupción mínima del servicio.
Puede agregar réplicas de Amazon DocumentDB adicionales. Las réplicas de Amazon DocumentDB comparten el mismo almacenamiento subyacente que la instancia principal. Puede convertir cualquier réplica de Amazon DocumentDB en instancia principal sin que se produzcan pérdidas de datos, por lo que puede utilizarla para mejorar la tolerancia a errores en caso de que se produzca algún error en la instancia principal. Para aumentar la disponibilidad del clúster, solo tiene que crear de una a quince réplicas, en varias zonas de disponibilidad, y Amazon DocumentDB las incluirá automáticamente en la selección de instancias principales para la conmutación por error en el caso de que se produzca una interrupción de la instancia.
Amazon DocumentDB administra automáticamente la conmutación por error para que las aplicaciones puedan reanudar las operaciones de la base de datos a la mayor brevedad posible sin intervención administrativa manual.
- Si dispone de una instancia de réplica de Amazon DocumentDB en la misma zona de disponibilidad o en otra distinta, al realizar la conmutación por error, Amazon DocumentDB cambia el registro de nombre canónico (CNAME) por su instancia para que apunte a la réplica que funciona correctamente, que, a su vez, se transforma en la nueva instancia principal. La conmutación por error completa normalmente finaliza en 30 segundos o menos.
- Si no dispone de una instancia de réplica de Amazon DocumentDB (es decir, un clúster de instancia única), Amazon DocumentDB tratará de crear una nueva instancia en la misma zona de disponibilidad en la que se encuentra la instancia original. Este reemplazo de la instancia original se lleva a cabo con el mayor esfuerzo, pero puede fallar, por ejemplo, si existe un problema que esté afectando a la zona de disponibilidad de manera generalizada.
La aplicación debe reintentar las conexiones de la base de datos en caso de que se pierda la conexión.
Amazon DocumentDB puede detectar automáticamente cualquier problema en la instancia principal y comenzar a direccionar el tráfico de lectura y escritura a una instancia de réplica de Amazon DocumentDB. En promedio, la conmutación por error finaliza en 30 segundos o menos. Además, el tráfico de lectura que atendían las instancias de réplicas de Amazon DocumentDB se interrumpirá brevemente.
Dado que las réplicas de Amazon DocumentDB comparten el mismo volumen de datos que la instancia principal, no se produce prácticamente ningún retraso de replicación. Normalmente, observamos retrasos de decenas de milisegundos.
Seguridad y cumplimiento
Abrir todoSí. Todas las instancias de Amazon DocumentDB se deben crear en una Amazon VPC. Con Amazon VPC, puede definir una topología de red virtual que se asemeja estrechamente a la red tradicional de su propio centro de datos. Esto permite ejercer un control pleno sobre quién puede obtener acceso a las bases de datos de Amazon DocumentDB.
Amazon DocumentDB es compatible con el RBAC que incluye roles integrados. El RBAC le permite imponer privilegios mínimos como práctica recomendada mediante la restricción de las acciones que los usuarios están autorizados a realizar. Para más información, consulte la sección Control de acceso basado en roles en Amazon DocumentDB.
Amazon DocumentDB utiliza Amazon VPC para imponer límites estrictos de red y de autorización. Las políticas, los roles y los usuarios de IAM proporcionan la autenticación y la autorización para las API de administración de Amazon DocumentDB. La autenticación en una base de datos de Amazon DocumentDB se realiza mediante las herramientas y los controladores estándar de MongoDB con el Mecanismo de Autenticación de Desafío y Respuesta con Sal (SCRAM), que es el mecanismo de autenticación predeterminado de MongoDB.
Sí. Amazon DocumentDB permite cifrar los clústeres mediante las claves que administra a través de AWS Key Management Service (KMS). En un clúster que ejecuta el cifrado de Amazon DocumentDB, los datos almacenados en reposo en el almacenamiento subyacente están cifrados, al igual que sus copias de seguridad automáticas, sus instantáneas y sus réplicas dentro del mismo clúster. El cifrado y el descifrado se administran sin problemas. Para obtener más información sobre el uso de KMS con Amazon DocumentDB, consulte el Cifrado de datos en reposo de Amazon DocumentDB.
Actualmente, no se puede cifrar una instancia de Amazon DocumentDB que no esté cifrada. Si desea utilizar el cifrado de Amazon DocumentDB para un clúster existente no cifrado, cree un nuevo clúster con cifrado habilitado y migre los datos a este.
Amazon DocumentDB fue diseñado para cumplir con los estándares de seguridad más elevados y para facilitarle la verificación de nuestras medidas de seguridad, así como el cumplimiento de sus propias obligaciones normativas y de conformidad. Se ha evaluado que cumple con PCI DSS, ISO 9001, 27001, 27017 y 27018; con SOC 1, 2 y 3; y con la certificación del Marco Común de Seguridad (CSF) de la Health Information Trust Alliance (HITRUST), además de ser apto para HIPAA. Puede descargar los informes de cumplimiento de AWS en AWS Artifact.
Actualización de la versión principal
Abrir todoLa actualización local de la versión principal (MVU) le permite actualizar los clústeres de Amazon DocumentDB 3.6 o 4.0 a Amazon DocumentDB 5.0 mediante la consola de AWS, el kit de desarrollo de software (SDK) o la interfaz de línea de comandos (CLI). Con la actualización de versión principal in situ (MVU), no es necesario crear nuevos clústeres ni cambiar los puntos de conexión. La actualización de versión principal in situ (MVU) está disponible a partir de la versión 5.0 de Amazon DocumentDB. Para comenzar a utilizar la actualización de versión principal in situ (MVU), revise la documentación de MVU in situ.
La MVU in situ le permite actualizar sin problemas sus clústeres de Amazon DocumentDB 3.6 o 4.0 a la versión 5.0 sin necesidad de realizar copias de seguridad y restauraciones en otro clúster y sin utilizar otras herramientas de migración de datos. Al hacerlo, reduce el tiempo y el esfuerzo asociados con el proceso de actualización habitual, que implica configurar los puntos finales de origen y destino, migrar índices y datos, cambiar el código de la aplicación y más.
No necesitará cambiar el punto de conexión de sus aplicaciones después de la actualización. Como los datos permanecen en el mismo clúster, no existe un costo adicional al realizar la actualización mediante esta característica.
El tiempo de inactividad puede variar de un clúster a otro según la cantidad de colecciones, índices, bases de datos e instancias. Antes de ejecutar la actualización de versión principal in situ en el clúster de producción, recomendamos encarecidamente realizarla primero en un entorno inferior para probar el tiempo de inactividad, el rendimiento y, además, verificar que las aplicaciones funcionen como se espera después de la actualización.
También puede utilizar la característica de clonación rápida para clonar los datos del clúster con fines de prueba. Según la complejidad de la implementación de Amazon DocumentDB, puede solicitar la asistencia de nuestro arquitecto de soluciones de bases de datos para obtener ayuda adicional.
La MVU local solo es compatible con Amazon DocumentDB 3.6 o 4.0 como fuente y la versión 5.0 como destino. No es compatible con los clústeres globales de Amazon DocumentDB, los clústeres elásticos ni con DocumentDB 4.0 como versión de destino.
IA generativa
Abrir todoLa búsqueda vectorial es un método utilizado en machine learning (ML) para encontrar puntos de datos similares a un punto de datos determinado mediante la comparación de sus representaciones vectoriales a través de métricas de distancia o similitud. Cuanto más cerca estén los dos vectores en el espacio vectorial, más similares se considerarán los elementos subyacentes. Esta técnica ayuda a capturar el significado o la semántica de los datos. Este enfoque es útil en diversas aplicaciones, como los sistemas de recomendación, el procesamiento de lenguaje natural y el reconocimiento de imágenes.
La búsqueda vectorial para Amazon DocumentDB combina la flexibilidad y la amplia capacidad de consulta de una base de datos de documentos basada en JSON con la potencia de la búsqueda vectorial. Puede utilizar los datos de Amazon DocumentDB existentes, o una estructura de datos de documentos flexible, para crear casos de uso de machine learning e IA generativa, como experiencias de búsqueda semántica, recomendaciones de productos, personalización, chatbots, detección de fraudes y detección de anomalías. Visite el apartado de búsqueda vectorial de la documentación de Amazon DocumentDB para obtener más información.
La búsqueda vectorial de Amazon DocumentDB está disponible en clústeres basados en instancias de Amazon DocumentDB 5.0.
La búsqueda vectorial para Amazon DocumentDB permite el uso de la búsqueda semántica para que pueda capturar el significado, el contexto y la intención de los datos. La búsqueda por palabra clave busca el documento basándose en el texto real o en las asignaciones de sinónimos predefinidas. Por ejemplo, en una aplicación de comercio electrónico tradicional, la búsqueda “vestido rojo” puede devolver productos que tengan las palabras “rojo” y “vestido” en sus descripciones. La búsqueda semántica arrojará resultados con vestidos en diferentes tonos de rojo que pueden mejorar la experiencia del usuario.
El uso de la búsqueda vectorial para Amazon DocumentDB no conlleva ningún costo adicional. Se aplicarán los cargos estándar de procesamiento, E/S, almacenamiento y copia de seguridad al almacenar, indexar y buscar vectores en Amazon DocumentDB. Visite la página de precios de Amazon DocumentDB para obtener más información.
Amazon DocumentDB se integra con Amazon SageMaker Canvas, lo que facilita crear modelos de machine learning (ML) y personalizar modelos fundacionales con los datos almacenados en Amazon DocumentDB sin escribir una sola línea de código. Ya no necesita desarrollar canalizaciones personalizadas de datos y de machine learning entre Amazon DocumentDB y SageMaker Canvas. Puede iniciar SageMaker Canvas desde la consola de Amazon DocumentDB y añadir las bases de datos de Amazon DocumentDB existentes como fuente de datos para empezar a crear sus modelos de machine learning. Puede usar los datos en DocumentDB dentro de SageMaker Canvas para crear modelos que predigan la pérdida de clientes, detecten fraude, predigan fallas de mantenimiento, pronostiquen métricas financieras y ventas, optimicen el inventario, resuman contenido y generen contenido.
La integración de Amazon DocumentDB con Amazon SageMaker Canvas facilita la creación de aplicaciones de inteligencia artificial generativa (IA) y de machine learning (ML) con los datos almacenados en Amazon DocumentDB. Ya no necesita desarrollar canalizaciones de datos y ML personalizadas entre Amazon DocumentDB y SageMaker Canvas. La integración en la consola elimina el trabajo pesado e indiferenciado de conectarse y acceder a datos para acelerar el desarrollo de su ML con una experiencia de bajo código o sin código (LCNC, low code no code). Puede lanzar SageMaker Canvas desde la consola de Amazon DocumentDB y agregar bases de datos de Amazon DocumentDB existentes como origen de datos.
Amazon SageMaker Canvas ofrece una interfaz sin código para crear modelos de machine learning con datos provenientes de diversos orígenes, incluido Amazon DocumentDB. Se le cobrará por el uso de SageMaker Canvas y por las E/S resultantes cuando SageMaker Canvas lea datos de su instancia de Amazon DocumentDB. El uso de DocumentDB como origen de datos en Amazon SageMaker Canvas no conlleva ningún cargo adicional. Visite la página de precios de Amazon DocumentDB y la página de precios de SageMaker Canvas para obtener más información.
Integración sin ETL
Abrir todoLa integración sin ETL de Amazon DocumentDB con Amazon OpenSearch Service abstrae la complejidad operativa de extraer, transformar y cargar (ETL) los datos desde una colección de Amazon DocumentDB hacia un clúster administrado de Amazon OpenSearch o hacia una colección sin servidor. Con esta integración, ya no tendrá que crear ni administrar canalizaciones de datos ni transformar datos.
Si desea utilizar las API de MongoDB, debe utilizar las capacidades de bases de datos nativas de Amazon DocumentDB para realizar búsquedas vectoriales en los documentos. La integración sin ETL de Amazon DocumentDB con Amazon OpenSearch Service es ideal para buscar en colecciones y para almacenar e indexar vectores con más de 2000 dimensiones.
La integración sin ETL de Amazon DocumentDB con Amazon OpenSearch Service utiliza Ingesta de Amazon OpenSearch para transferir sin problemas los datos operativos de Amazon DocumentDB a Amazon OpenSearch Service. Para empezar, habilite la funcionalidad de transmisión de cambios en la colección de Amazon DocumentDB que se debe replicar. La característica de integración sin ETL configura en la cuenta una canalización de ingesta de Amazon OpenSearch que replica automáticamente los datos en un clúster administrado de Amazon OpenSearch Service o en una colección sin servidor.
Ingesta de Amazon OpenSearch reconoce de manera automática el formato de los datos de las colecciones de Amazon DocumentDB y los asigna a Amazon OpenSearch Service para obtener los resultados de búsqueda más eficaces. Puede sincronizar los datos de varias colecciones de Amazon DocumentDB a través de varias canalizaciones en un único clúster administrado de Amazon OpenSearch o en una colección sin servidor para ofrecer información integral sobre varias aplicaciones. Si lo desea, puede especificar encargados del tratamiento de datos personalizados al definir la configuración de ingesta en Amazon OpenSearch Service. Las actualizaciones posteriores de las colecciones de Amazon DocumentDB también se replicarán en Amazon OpenSearch Service sin que se requiera intervención manual.
Esta integración sin ETL se beneficia de las capacidades nativas de transformación de datos de las canalizaciones de Ingesta de Amazon OpenSearch para agregar y filtrar los datos mientras estén en movimiento.
También puede escribir una lógica de transformación personalizada si desea una capacidad de transformación personalizada, e Ingesta de Amazon OpenSearch administrará el proceso de transformación. De manera alternativa, si desea trasladar todos los datos del origen al receptor sin personalizar, Ingesta de Amazon OpenSearch proporciona esquemas listos para usar de modo que pueda realizar las integraciones con tan solo unos pocos clics.
Para garantizar que Ingesta de Amazon OpenSearch cuente con los permisos necesarios para replicar los datos de Amazon DocumentDB, la característica de integración sin ETL crea un rol de IAM con los permisos necesarios para leer datos de la colección de Amazon DocumentDB y escribir en un dominio o colección de Amazon OpenSearch. Luego, las canalizaciones de la ingesta de Amazon OpenSearch asumen este rol para garantizar que siempre se mantenga la postura de seguridad correcta al trasladar los datos del origen al destino.
Puede ver todas las métricas relacionadas con la integración sin ETL con Amazon DocumentDB en los paneles de consola proporcionados por Amazon DocumentDB y la canalización de Ingesta de OpenSearch. También puede consultar los registros en tiempo real en Amazon CloudWatch y configurar alertas personalizadas con Amazon CloudWatch que se activan cuando se superan los umbrales definidos por el usuario.