Amazon Redshift es el almacén de datos en la nube más rápido y más utilizado. Redshift se integra a su lago de datos, ofrece un rendimiento tres veces superior en comparación con cualquier otro almacén de datos y cuesta hasta un 75 % menos que cualquier otro almacén de datos en la nube.

Características y beneficios

Todos los años, presentamos cientos de características y mejoras de productos, con base en los casos de uso y los comentarios de los clientes. Más información sobre las novedades.

Nivel de integración máximo con lagos de datos y servicios de AWS

Amazon Redshift le permite trabajar de forma rápida y simple con los datos en formatos abiertos. Además, se conecta fácilmente al ecosistema de AWS.

Realice consultas en datos y expórtelos hacia y desde un lago: ningún otro almacén en la nube facilita tanto la realización de consultas en datos y la escritura de éstos en un lago en formatos abiertos. Puede realizar consultas en formatos de archivo abiertos, como Parquet, ORC, JSON, Avro, CSV y más directamente en S3 mediante el uso del conocido SQL ANSI. Para exportar datos a un lago de datos, tan solo debe usar el comando UNLOAD de Redshift en el código SQL y especificar Parquet como el formato de archivo. A continuación, Redshift se encarga automáticamente de darle formato a los datos y de migrarlos a S3. Esto le da la flexibilidad para almacenar datos con un alto nivel de estructuración y a los que se obtiene acceso frecuentemente en un almacén de datos de Redshift y, al mismo tiempo, conservar exabytes de datos estructurados, semiestructurados y no estructurados en S3. Exportar datos desde Redshift de regreso a un lago de datos le permite analizar los datos más a fondo con servicios de AWS como Amazon Athena, Amazon EMR y Amazon SageMaker

Consulta federada: con la nueva capacidad de consulta federada de Redshift, puede trabajar con su base de datos relacional operativa. Realice consultas de datos en directo en una o más bases de datos de Amazon RDS y Aurora PostgreSQL para lograr una visibilidad instantánea de las operaciones empresariales integrales sin necesidad de trasladar datos. Puede combinar datos de un almacén de datos de Redshift, de un lago de datos y, ahora, de almacenes operativos, para tomar mejores decisiones basadas en datos. Redshift ofrece optimizaciones sofisticadas para reducir el movimiento de datos en la red y las complementa con procesamiento de datos en paralelo masivo para consultas de alto rendimiento. Más información.

Ecosistema de análisis de AWS: la integración nativa con el ecosistema de análisis de AWS facilita la gestión de los flujos de trabajo de análisis integrales sin inconvenientes. Por ejemplo, AWS Lake Formation es un servicio que facilita la configuración de un lago de datos seguro en cuestión de días. AWS Glue puede extraer, transformar y cargar (ETL) datos a Redshift. Amazon Kinesis Data Firehose es la forma más fácil de recopilar, transformar y cargar datos de streaming en Redshift para realizar análisis casi en tiempo real. Puede usar Amazon EMR para procesar datos con Hadoop/Spark y cargar el resultado en Amazon Redshift para tareas de inteligencia empresarial y análisis. Amazon QuickSight es el primer servicio de inteligencia empresarial con precios de pago por sesión que puede usar para crear informes, visualizaciones y paneles en datos de Redshift. Puede usar Redshift para preparar datos con el fin de ejecutar cargas de trabajo de aprendizaje automático con Amazon SageMaker. Para agilizar las migraciones a Amazon Redshift, puede usar AWS Schema Conversion Tool y AWS Database Migration Service (DMS). Amazon Redshift también está profundamente integrado con Amazon Key Management Service (KMS) y Amazon Cloudwatch para asuntos de seguridad, monitorización y conformidad.

Mejor rendimiento

Amazon Redshift ofrece rendimiento ágil y líder en el sector combinado con flexibilidad.

Instancias RA3: las instancias RA3 ofrecen un rendimiento 3 veces superior al de cualquier servicio de almacén de datos en la nube. Estas instancias de Amazon Redshift maximizan la velocidad para cargas de trabajo con uso intensivo del rendimiento que necesitan grandes volúmenes de capacidad de cómputo, con la flexibilidad para pagar el cómputo y el almacenamiento de forma independiente, mediante la especificación de la cantidad de instancias que necesita. Más información.

Almacenamiento eficiente y procesamiento de consultas con alto rendimiento: Amazon Redshift ofrece un rendimiento de consulta rápido en conjuntos de datos que varían en tamaño, desde gigabytes a petabytes. El almacenamiento en columnas, la compresión de datos y las asignaciones de zona reducen la cantidad de operaciones de E/S necesarias para realizar consultas. Además de las codificaciones estándar del sector, como LZO y Zstandard, Amazon Redshift también ofrece la codificación de compresión AZ64, elaborada específicamente para tipos numéricos y de fecha/hora a fin de ofrecer ahorros en almacenamiento y rendimiento de consultas optimizado.

Vistas materializadas: las vistas materializadas de Amazon Redshift brindan un rendimiento de consulta notablemente más rápido para las cargas de trabajo analíticas como paneles, consultas de herramientas de inteligencia empresarial (BI) y trabajos de procesamiento de datos ELT (extraer, cargar y transformar). Puede utilizar las vistas materializadas para almacenar en caché los resultados intermedios a fin de agilizar las consultas de ejecución lenta. Amazon Redshift puede conservar de forma eficiente y gradual las vistas materializadas para continuar suministrando beneficios de rendimiento de baja latencia. Más información

Aprendizaje automático para maximizar el procesamiento y el rendimiento: las capacidades de aprendizaje automático avanzadas de Amazon Redshift ofrecen un nivel de procesamiento y rendimiento alto, inclusive con cargas de trabajo diversas o actividad de usuarios simultánea. Amazon Redshift utiliza algoritmos sofisticados para predecir y clasificar consultas entrantes con base en los tiempos de ejecución y los requisitos de los recursos para administrar de forma dinámica el rendimiento y la simultaneidad, al mismo tiempo que ayuda a priorizar las cargas de trabajo clave para la empresa. La aceleración de consultas cortas (SQA) envía consultas breves a partir de aplicaciones como paneles a una cola exprés para que se procesen inmediatamente, en vez de quedar estancadas detrás de consultas largas. La administración de cargas de trabajo automática (WLM) usa aprendizaje automático para administrar memoria y simultaneidad de forma dinámica, lo que ayuda a maximizar el procesamiento de consultas. Además, ahora puede definir de manera sencilla la prioridad de las consultas más importantes, inclusive cuando se envían cientos de ellas. Amazon Redshift también es un sistema de autoaprendizaje que observa las cargas de trabajo de los usuarios continuamente, determina las oportunidades para mejorar el rendimiento a medida que crece el uso, aplica optimizaciones sistemáticamente y realiza recomendaciones mediante Redshift Advisor cuando se necesita una acción de usuario explícita para agilizar aún más el rendimiento de Amazon Redshift. 

Almacenamiento de resultados en caché: Amazon Redshift utiliza el almacenamiento en caché de resultados a fin de ofrecer tiempos de respuesta menores a un segundo para las consultas repetidas. Las herramientas de panel, visualización e inteligencia empresarial que ejecutan consultas repetidas reciben un importante aumento del rendimiento. Cuando se ejecuta una consulta, Amazon Redshift busca en la caché para saber si hay un resultado almacenado de una consulta anterior. Si encuentra un resultado almacenado en caché y los datos no han cambiado, devuelve inmediatamente dicho resultado en lugar de volver a ejecutar la consulta.

Escalabilidad máxima

Ya sea que necesite ajustar la escala de datos o usuarios, Amazon Redshift es prácticamente ilimitado. 

Almacenamiento de datos a escala de petabytes: Amazon Redshift es simple y aumenta su escala rápidamente a medida que cambian las necesidades. Con unos pocos clics en la consola o una simple llamada a la API, puede cambiar de manera sencilla la cantidad o el tipo de nodos en el almacén de datos, y ajustar la escala horizontal o verticalmente a medida que cambien las necesidades. Con el almacenamiento administrado, se agrega capacidad automáticamente para admitir cargas de trabajo de hasta 8 PB de datos comprimidos. 

Análisis en lagos de datos a escala de petabytes: puede ejecutar consultas en petabytes de datos en Amazon S3 sin tener que cargar ni transformar ningún dato con la característica Redshift Spectrum. Puede utilizar S3 como un lago de datos de alta disponibilidad, seguro y rentable para almacenar volúmenes de datos ilimitados en formatos de datos abiertos. Amazon Redshift Spectrum ejecuta consultas en miles de nodos en paralelo para ofrecer resultados rápidos, independientemente de la complejidad de la consulta o del volumen de datos.  

Simultaneidad ilimitada: Amazon Redshift proporciona un rendimiento constante y rápido, incluso con miles de consultas simultáneas, ya sea que consulten datos en su almacén de datos de Amazon Redshift o directamente en su lago de datos de Amazon S3. El ajuste de escala de simultaneidad de Amazon Redshift admite consultas y usuarios simultáneos prácticamente ilimitados con niveles de servicio estables mediante la incorporación de capacidad transitoria en segundos a medida que aumenta la simultaneidad. 

Máximos beneficios

Utilizar Amazon Redshift como almacén de datos en la nube le da flexibilidad para pagar la capacidad de cómputo y almacenamiento por separado, costos predecibles en controles y opciones para pagar por consumo o ahorrar hasta un 75 % con un compromiso de uso de instancia reservada.

Opciones de precios flexibles: Amazon Redshift es el almacén de datos más rentable. Tiene opciones para optimizar la forma de pago de su almacén. Puede empezar por tan solo 0,25 USD por hora sin compromisos e incrementar la escala por tan solo 1000 USD por terabyte al año. Amazon Redshift es el único almacén de datos en la nube que ofrece precios con modalidad bajo demanda sin costos iniciales, precios de instancias reservadas que pueden ahorrarle hasta un 75 % con un contrato de 1 o 3 años, y precios por consulta, basados en el volumen de datos escaneados en el lago de datos de Amazon S3. Los precios de Amazon Redshift incluyen transferencia de datos, almacenamiento para copias de seguridad, compresión de datos y seguridad integrada. A medida que aumente el volumen de los datos, puede usar el almacenamiento administrado en las instancias RA3 para almacenar datos de manera rentable a 0,024 USD por GB al mes.

Costo predecible, incluso con cargas de trabajo impredecibles: Amazon Redshift permite a los clientes ajustar la escala con un impacto mínimo en los costos, ya que cada grupo obtiene hasta una hora de créditos de ajuste de escala de simultaneidad gratuitos por día. Estos créditos gratuitos son suficientes para cubrir las necesidades de simultaneidad del 97 % de los clientes. Esto le da previsibilidad en su costo mensual, incluso durante los períodos de fluctuación de la demanda analítica. 

Seleccione un tipo de nodo a fin de obtener los mayores beneficios para las cargas de trabajo: puede elegir tres tipos de instancias para optimizar Amazon Redshift de acuerdo con sus necesidades de almacenamiento de datos.

Los nodos RA3 le permiten escalar el almacenamiento de manera independiente del cómputo. Con RA3, obtiene un almacén de datos de alto rendimiento que guarda datos en una capa de almacenamiento independiente. Tan solo debe ajustar el tamaño del almacén de datos en función del rendimiento de consultas que necesite.

Los nodos de cómputo denso (DC) le permiten crear almacenes de datos de rendimiento muy elevado con CPU rápidas, gran capacidad de RAM y discos de estado sólido (SSD). Son la mejor opción para volúmenes de datos inferiores a los 500 GB.

Los nodos DS2 (almacenamiento denso) le permiten crear almacenes de datos grandes mediante el uso de unidades de disco duro (HDD) por un precio bajo cuando se compran instancias reservadas a 3 años, lo que lo convierte en el tipo de nodo más rentable para el almacenamiento de cargas de trabajo pesadas. La mayoría de los clientes que usan clústeres de DS2 pueden migrar cargas de trabajo a clústeres de RA3 y obtener un rendimiento hasta 2 veces superior y más almacenamiento por el mismo costo que DS2.
Para ajustar la escala de un clúster o cambiar entre los distintos tipos de nodos, basta con realizar una única llamada a la API o hacer unos pocos clics en la consola de AWS. Consulte la página de precios para obtener más información.

Fácil de administrar

Amazon Redshift automatiza tareas de mantenimiento comunes para que pueda enfocarse en la obtención de información a partir de sus datos, no en el almacén de datos.

Aprovisionamiento automatizado: Amazon Redshift es simple de configurar y operar. Puede implementar un nuevo almacén de datos con solo unos clics en la consola de AWS y Amazon Redshift aprovisionará automáticamente la infraestructura por usted. La mayoría de las tareas administrativas está automatizada, como la generación de copias de seguridad y la replicación. Si necesita un mayor control, existen opciones para ayudarlo a realizar ajustes adaptados a sus cargas de trabajo específicas. Las nuevas capacidades se lanzan de forma transparente, lo que elimina la necesidad de programar e implementar actualizaciones y parches.

Copias de seguridad automatizadas: los datos de Amazon Redshift se respaldan automáticamente en Amazon S3 y Amazon Redshift puede replicar de forma asíncrona las instantáneas en S3 en otra región para casos de recuperación de desastres. Puede utilizar cualquier instantánea del sistema o del usuario para restablecer el clúster con la consola de administración de AWS o con las API de Redshift. El clúster se encuentra disponible en cuanto se restablecen los metadatos del sistema y puede comenzar a ejecutar consultas mientras los datos de usuario se ponen en cola en segundo plano.

Tolerancia a errores: existen varias características que mejoran la fiabilidad del clúster de almacén de datos. Por ejemplo, Amazon Redshift monitoriza constantemente el estado del clúster, vuelve a replicar automáticamente los datos de unidades defectuosas y reemplaza los nodos según sea necesario para admitir la tolerancia a errores.

Consultas flexibles: Amazon Redshift le brinda la flexibilidad de ejecutar consultas dentro de la consola o conectar herramientas de clientes SQL, bibliotecas o herramientas de inteligencia empresarial. El editor de consultas en la consola de AWS proporciona una interfaz eficiente para ejecutar consultas SQL en clústeres de Amazon Redshift y para ver los resultados y el plan de ejecución de las consultas (para aquellas ejecutadas en los nodos de cómputo) adyacentes a sus consultas.

Procesamiento nativo de datos espaciales: Amazon Redshift admite la funcionalidad de procesamiento nativo de datos espaciales. Esta capacidad permite a los clientes almacenar, recuperar y procesar datos espaciales y potenciar sin dificultades información empresarial mediante la integración de los datos espaciales en sus consultas analíticas. Amazon Redshift ofrece un tipo de dato polimórfico, GEOMETRY, que admite varias formas geométricas, como Point, Linestring, Polygon, etc. Redshift también provee funciones de SQL espaciales nuevas para crear formas geométricas, importar, exportar y procesar datos espaciales, como así también para poder acceder a ellos. Puede agregar columnas de GEOMETRY a las tablas de Redshift y escribir consultas en SQL que abarquen datos espaciales y no espaciales. Gracias a la capacidad de Redshift de consultar lagos de datos sin inconvenientes, ahora también puede extender fácilmente el procesamiento espacial a los lagos de datos mediante la integración de tablas externas a las consultas espaciales.

Integración con herramientas de terceros: existen muchas opciones para trabajar con herramientas y expertos líderes del sector para cargar, transformar y visualizar datos a fin de mejorar las características de Amazon Redshift. Los socios que integran nuestra amplia lista han certificado sus soluciones para que funcionen con Amazon Redshift.

Seguridad y conformidad máximas

AWS cuenta con capacidades de seguridad integrales para cumplir los requisitos más demandantes y Amazon Redshift ofrece seguridad para datos sin costo adicional.

Cifrado integral: con tan solo un par de ajustes de los parámetros, puede configurar Amazon Redshift para utilizar SSL a fin de proteger los datos en tránsito y el cifrado AES-256 acelerado por hardware para los datos en reposo. Si decide habilitar el cifrado de los datos en reposo, se cifrarán todos los datos que se graben en el disco y las copias de seguridad. De forma predeterminada, Amazon Redshift se ocupa de la administración de claves.

Aislamiento de la red: Amazon Redshift le permite configurar las reglas del firewall para controlar el acceso de red al clúster de almacén de datos. Puede ejecutar Redshift en Amazon Virtual Private Cloud (VPC) para aislar el clúster de almacenamiento de datos en su propia red virtual y conectarlo a la infraestructura de TI existente mediante conexiones IPsec VPN cifradas estándar del sector.

Auditoría y conformidad. Amazon Redshift se integra con AWS CloudTrail para que pueda auditar todas las llamadas a las API de Redshift. Redshift registra todas las operaciones SQL, como los intentos de conexión, las consultas y los cambios realizados en el almacén de datos. Puede obtener acceso a estos registros mediante la realización de consultas SQL en las tablas del sistema u optar por guardarlos en una ubicación segura de Amazon S3. Amazon Redshift cumple los requisitos de SOC 1, SOC 2, SOC 3 y PCI DSS de nivel 1. Para obtener más información, visite Conformidad en la nube de AWS.

Controles de acceso pormenorizado: los controles de seguridad a nivel de columnas y filas garantizan que los usuarios solo vean los datos a los cuales tienen acceso. Amazon Redshift se integra con AWS Lake Formation, lo que garantiza que los controles de acceso a nivel de columnas de Lake Formation también se apliquen a consultas de Redshift en los datos del lago de datos.

Más información sobre las novedades.

Consulte la documentación de Amazon Redshift para leer información detallada del producto.

Más información sobre los precios de Amazon Redshift

Visite la página de precios
¿Listo para crear?
Introducción a Amazon Redshift
¿Tiene más preguntas?
Contacte con nosotros