Amazon Redshift amplía la capacidad de ejecutar consultas de almacén de datos en un lago de datos, sin necesidad de realizar cargas. Puede ejecutar consultas analíticas en petabytes de datos almacenados localmente en Redshift y de manera directa en exabytes de datos almacenados en Amazon S3. Es fácil de configurar, automatiza la mayoría de las tareas administrativas y ofrece un rendimiento ágil a cualquier escala.

Características principales

Rendimiento más ágil

Procesamiento en paralelo de forma masiva: Amazon Redshift ofrece un rendimiento de consulta rápido en conjuntos de datos que varían en tamaño, desde gigabytes a exabytes. Redshift utiliza almacenamiento en columnas, compresión de datos y asignaciones de zona para reducir la cantidad de operaciones de E/S necesarias para realizar consultas. Usa una arquitectura de almacén de datos de procesamiento en paralelo de forma masiva (MPP) para hacer procesar en paralelo y distribuir operaciones SQL con el fin de aprovechar todos los recursos disponibles. El hardware subyacente se diseñó para lograr un procesamiento de datos de alto rendimiento. Utiliza un almacenamiento local asociado para maximizar el desempeño entre las unidades y las CPU, y una red de maya de alto ancho de banda para maximizar el desempeño entre los nodos.

Aprendizaje automático: Amazon Redshift utiliza el aprendizaje automático para ofrecer alto desempeño en función de las cargas de trabajo. Redshift utiliza sofisticados algoritmos para predecir los tiempos de ejecución de las consultas entrantes y los asigna a la cola óptima para lograr el procesamiento más rápido. Por ejemplo, las consultas tales como paneles e informes con altos requisitos de uso simultáneo se dirigen a una cola exprés para su procesamiento inmediato.

Almacenamiento en caché de resultados: Amazon Redshift utiliza el almacenamiento en caché de resultados a los fines de ofrecer tiempos de respuesta menores a un segundo para las consultas repetidas. Las herramientas de panel, visualización e inteligencia empresarial que ejecutan consultas repetidas reciben un importante aumento del rendimiento. Cuando se ejecuta una consulta, Redshift busca en la caché para verificar si hay un resultado almacenado de una consulta anterior. Si encuentra un resultado almacenado en caché y los datos no han cambiado, devuelve inmediatamente dicho resultado en lugar de volver a ejecutar la consulta.

Fácil de instalar, implementar y administrar

Aprovisionamiento automatizado: Amazon Redshift es simple de configurar y operar. Puede implementar un nuevo almacén de datos con solo unos clics en la consola de AWS y Redshift aprovisionará automáticamente la infraestructura por usted. La mayoría de las tareas administrativas son automáticas, como las copias de seguridad y la replicación, por lo que puede centrarse en sus datos, en lugar de en la administración. Si necesita un mayor control, Redshift proporciona opciones para ayudarlo a realizar ajustes adaptados a sus cargas de trabajo específicas. Las nuevas capacidades se lanzan de forma transparente, lo que elimina la necesidad de programar y aplicar actualizaciones y parches.

Copias de seguridad automatizadas: Amazon Redshift realiza copias de seguridad de los datos en Amazon S3 de forma automática y constante. Redshift puede replicar de forma asíncrona las instantáneas en S3 en otra región para casos de recuperación de desastres. Puede utilizar cualquier instantánea del sistema o del usuario para restablecer el clúster con la consola de administración de AWS o con las API de Redshift. El clúster se encuentra disponible en cuanto se restablecen los metadatos del sistema y puede comenzar a ejecutar consultas mientras los datos de usuario se ponen en cola en segundo plano.

Tolerante a errores: Amazon Redshift presenta varias características que mejoran la fiabilidad del clúster de almacén de datos. Redshift monitoriza constantemente el estado del clúster, vuelve a replicar automáticamente los datos de unidades defectuosas y reemplaza los nodos según sea necesario para admitir la tolerancia a errores.

Integración con herramientas de terceros: trabaje con herramientas y expertos líderes del sector para cargar, transformar y visualizar datos a fin de mejorar las características de Amazon Redshift. Los socios que integran nuestra amplia lista han certificado sus soluciones para que funcionen con Amazon Redshift.  

Rentabilidad

Sin costos iniciales, pague por lo que consuma: Amazon Redshift es el almacén de datos más rentable y solo paga por los recursos que aprovisione. Puede empezar por tan solo 0,25 USD por hora sin compromisos e incrementar la escala por tan solo 250 USD por terabyte al año. Redshift es el único almacén de datos en la nube que ofrece precios con modalidad bajo demanda sin costos iniciales, precios de instancias reservadas que pueden ahorrarle hasta un 75 % con un contrato de 1 o 3 años, y precios por consulta, basados en el volumen de datos escaneados en el lago de datos de Amazon S3. Para obtener más información, consulte la página de precios de Amazon Redshift.

Elija el tipo de nodo: puede seleccionar entre dos tipos de nodos a fin de optimizar Redshift para sus necesidades vinculadas con el almacenamiento de datos. Los nodos de computación densa (DC) le permiten crear almacenes de datos de rendimiento muy elevado con CPU rápidas, gran capacidad de RAM y discos de estado sólido (SSD). Si desea escalar aún más o reducir los costos, puede cambiar a nuestros tipos de nodos de Almacenamiento denso (DS) más rentables que usan unidades de disco duro más grandes a un precio muy bajo. Para escalar un clúster o cambiar entre los distintos tipos de nodos, basta con realizar una única llamada a la API o hacer unos pocos clics en la consola de AWS.

Escale rápidamente para satisfacer sus necesidades

Almacenamiento de datos a escala de petabytes: Amazon Redshift es simple y escala rápidamente a medida que cambian sus necesidades. Con unos pocos clics en la consola o una simple llamada a la API, puede cambiar de manera sencilla la cantidad o el tipo de nodos en su almacén de datos, y escalar horizontal o verticalmente a medida que cambien sus necesidades.

Análisis del lago de datos a escala de exabytes: Redshift Spectrum, una característica de Redshift, le permite ejecutar consultas en exabytes de datos en Amazon S3 sin tener que cargar ni transformar ningún dato. Puede utilizar S3 como un lago de datos de alta disponibilidad, seguro y rentable para almacenar volúmenes de datos ilimitados en formatos de datos abiertos.

Uso simultáneo ilimitado: Redshift Spectrum ofrece uso simultáneo ilimitado al permitir que múltiples consultas obtengan acceso a los mismos datos al mismo tiempo en Amazon S3. Redshift Spectrum ejecuta consultas en miles de nodos en paralelo para ofrecer resultados rápidos, independientemente de la complejidad de la consulta o del volumen de datos.

Realice consultas en su lago de datos

Lago de datos de Amazon S3: Amazon Redshift es el único almacén de datos que extiende la ejecución de consultas a su lago de datos de Amazon S3 sin necesidad de cargar datos. Puede consultar formatos de archivos abiertos que ya usa, como Avro, CSV, Grok, JSON, ORC, Parquet y más, directamente en S3. Esto le brinda la flexibilidad de almacenar datos altamente estructurados y a los que se obtiene acceso con frecuencia en los discos locales de Redshift, mantener exabytes de datos estructurados y no estructurados en S3 y realizar consultas sin problemas en ambos casos para proporcionar información única que no podría obtener si consultase conjuntos de datos independientes.

Ecosistema de análisis de AWS: Amazon Redshift está integrado de forma nativa con el ecosistema de análisis de AWS. AWS Glue puede extraer, transformar y cargar (ETL) datos a Redshift. Amazon Kinesis Data Firehose es la forma más fácil de recopilar, transformar y cargar datos de streaming en Redshift para realizar análisis casi en tiempo real. Puede usar Amazon QuickSight para crear informes, visualizaciones y paneles. Para agilizar la migración a Amazon Redshift, puede usar AWS Database Migration Service (DMS) de manera gratuita durante seis meses. Más información »

Seguridad

Cifrado integral: con tan solo un par de ajustes de los parámetros, puede configurar Amazon Redshift para utilizar SSL a fin de proteger los datos en tránsito y el cifrado AES-256 acelerado por hardware para los datos en reposo. Si decide habilitar el cifrado de los datos en reposo, se cifrarán todos los datos que se graben en el disco y las copias de seguridad. De forma predeterminada, Amazon Redshift se ocupa de la administración de claves.

Aislamiento de la red: Amazon Redshift le permite configurar las reglas del firewall para controlar el acceso de red al clúster de almacén de datos. Puede ejecutar Amazon Redshift en Amazon VPC para aislar el clúster de almacén de datos en su propia red virtual y conectarlo a la infraestructura de TI existente a través de conexiones de VPN IPsec cifradas estándar del sector.

Auditoría y conformidad: Amazon Redshift se integra con AWS CloudTrail para que pueda auditar todas las llamadas a las API de Redshift. Redshift registra todas las operaciones SQL, como los intentos de conexión, las consultas y los cambios realizados en la base de datos. Puede obtener acceso a estos registros mediante la realización de consultas SQL en las tablas del sistema u optar por descargarlos en una ubicación segura de Amazon S3. Amazon Redshift cumple los requisitos de SOC 1, SOC 2, SOC 3 y PCI DSS de nivel 1. Para obtener más información, visite Conformidad en la nube de AWS.

Más información sobre los precios de Amazon Redshift

Visite la página de precios
¿Listo para crear?
Introducción a Amazon Redshift
¿Tiene más preguntas?
Contacte con nosotros