La nube de AWS
La nube de AWS
Comenzar prueba gratuita

Amazon Redshift es un almacén de datos rápido y completamente administrado que permite analizar todos los datos empleando de forma sencilla y rentable SQL estándar y las herramientas de inteligencia empresarial (BI) existentes. Permite ejecutar consultas analíticas complejas en petabytes de datos estructurados, utilizando una sofisticada optimización de consultas, almacenamiento en columnas en discos locales de alto desempeño y ejecución masiva de consultas paralelas. La mayoría de los resultados se producen en segundos. Con Amazon Redshift, puede comenzar con poca capacidad por 0,25 USD por hora sin asumir ningún compromiso y escalar hasta varios petabytes por 1 000 USD por terabyte al año, menos de la décima parte del costo de las soluciones tradicionales.

Amazon Redshift también incluye Redshift Spectrum, que permite ejecutar directamente consultas SQL sobre exabytes de datos no estructurados en Amazon S3. Ya no se necesitan cargas ni transformaciones, y puede utilizar los siguientes formatos de datos abiertos, entre otros: Avro, CSV, Grok, ORC, Parquet, RCFile, RegexSerDe, SequenceFile, TextFile y TSV. Redshift Spectrum escala automáticamente la capacidad de cómputo de consulta en función de los datos que se recuperan, por lo que las consultas sobre Amazon S3 se ejecutan rápidamente, independientemente del tamaño del conjunto de datos. Obtenga más información sobre Redshift Spectrum »

Si desea aprender y conversar con expertos, participe en nuestra próxima presentación técnica: Serverless Analytics with Amazon Redshift Spectrum, AWS Glue, and Amazon QuickSight Inscribirme ahora >>

Desempeño rápido y constante

Rapidez

Amazon Redshift ofrece un desempeño de consulta rápido gracias a la utilización de la tecnología de almacenamiento en columnas para mejorar la eficacia de E/S y realizar consultas en paralelo entre varios nodos. La velocidad de carga de los datos aumenta de manera lineal con respecto al tamaño del clúster, con integraciones en Amazon S3, Amazon DynamoDB, Amazon EMR, Amazon Kinesis y en cualquier otro host con SSH habilitado.

Alto nivel de escalabilidad

Asequible

Solo paga por lo que utiliza. Puede tener una cantidad ilimitada de usuarios realizando tareas ilimitadas de análisis por tan solo 1 000 USD por terabyte al año, lo que supone una décima parte del costo de otras soluciones de almacenamiento de datos tradicionales. La mayoría de los clientes disfrutan de una reducción de entre tres y cuatro veces el tamaño de los datos después de la compresión, lo que permite sus costos entre 250 USD y 333 USD por terabyte no comprimido al año.

Desempeño rápido y estable

Ampliable

Redshift Spectrum permite ejecutar consultas en exabytes de datos en Amazon S3 tan fácilmente como ejecutar consultas sobre petabytes de datos almacenados en discos locales en Amazon Redshift, usando la misma sintaxis SQL y herramientas de BI que utiliza hoy en día. Puede almacenar datos altamente estructurados y de acceso frecuente en los discos locales de Redshift, mantener grandes cantidades de datos no estructurados en un ''lago de datos'' de Amazon S3 y realizar consultas sin problemas entre ambos.

Flexible

Sencillez

Amazon Redshift le permite automatizar con facilidad la mayoría de las tareas administrativas para administrar, monitorizar y escalar el almacén de datos. Con la administración de todas estas tareas que tanto trabajo y tiempo requieren, Amazon Redshift lo libera de ellas para que pueda dedicarse a los datos y a los aspectos empresariales.

Alto nivel de escalabilidad

Escalable

También puede modificar el tamaño del clúster con facilidad a medida que cambien sus necesidades de desempeño y capacidad con tan solo unos clics en la consola o mediante una sencilla llamada a la API.

Flexible

Seguro

La seguridad está integrada. Puede cifrar los datos en reposo y en tránsito con AES-256 acelerado por hardware y SSL, aislar los clústeres con Amazon VPC e incluso administrar las claves mediante AWS Key Management Service (KMS) y módulos de seguridad de hardware (HSM).

Programación dirigida por eventos

Compatibilidad

Amazon Redshift admite SQL estándar y proporciona complementos personalizados para JDBC y ODBC que se descargan de la consola, por lo que puede utilizar una amplia variedad de clientes SQL populares. También puede utilizar controladores JDBC y ODBC PostgreSQL estándar.

Almacenamiento de datos optimizado

Amazon Redshift utiliza una serie de innovaciones para obtener un desempeño muy alto de consulta en conjuntos de datos con una capacidad que oscila entre cien gigabytes y un exabyte o incluso más. Para datos locales a escala de petabytes, utiliza un almacenamiento en columna, compresión de datos y asignaciones de zona para reducir la cantidad de E/S necesaria para realizar consultas. Amazon Redshift cuenta con una arquitectura de almacenamiento de datos de procesamiento paralelo de forma masiva (MPP), que paraleliza y distribuye operaciones SQL para que pueda beneficiarse de todos los recursos disponibles. El hardware subyacente se ha diseñado para un procesamiento de datos de alto desempeño. Utiliza un almacenamiento adjunto local para maximizar el desempeño entre las unidades y las CPU y una red de maya de 10 GigE para maximizar el desempeño entre los nodos. Para los datos a escala exabyte en Amazon S3, Amazon Redshift genera un plan de consulta óptimo que minimiza la cantidad de datos escaneados y delega la ejecución de la consulta a un grupo de instancias de Redshift Spectrum que se escala automáticamente, por lo que las consultas se ejecutan rápidamente independientemente del tamaño de los datos.

Escala de petabytes

Con tan solo unos clics en la consola o una sencilla llamada a la API, puede cambiar con facilidad la cantidad o el tipo de nodos del almacén de datos y escalar hasta alcanzar un petabyte o más de datos de usuario comprimidos. Los nodos de almacenamiento denso (DS) le permiten crear almacenes de datos muy grandes con unidades de disco duro (HDD) por un precio muy bajo. Los nodos de informática densa (DC) le permiten crear almacenes de datos de desempeño muy elevado con CPU rápidas, grandes cantidades de RAM y discos de estado sólido (SSD). Mientras se modifica el tamaño, Amazon Redshift le permite seguir realizando consultas en su almacén de datos en modo de solo lectura hasta que el nuevo clúster esté totalmente aprovisionado y listo para su uso.

Consulta del ''lago de datos'' de Amazon S3

Redshift Spectrum permite ejecutar consultas sobre exabytes de datos no estructurados en Amazon S3, sin necesidad de carga o ETL. Cuando emite una consulta, va al punto de enlace de Amazon Redshift SQL, que genera y optimiza un plan de consulta. Amazon Redshift determina qué datos son locales y lo que hay en Amazon S3, genera un plan para minimizar la cantidad de datos de Amazon S3 que necesita leerse, solicita a los empleados de Amazon Redshift Spectrum un grupo de recursos compartidos para leer y procesar datos de Amazon S3, y obtiene los resultados de nuevo en el clúster de Amazon Redshift de cualquier procesamiento restante.

Sin costos iniciales

Solo tendrá que pagar por la capacidad que aprovisione. Puede elegir precios de instancias bajo demanda sin costos iniciales ni compromisos a largo plazo o bien beneficiarse de tarifas significativamente reducidas con los precios aplicables a las instancias reservadas. Los precios bajo demanda comienzan desde tan solo 0,25 USD por hora para nodos DC1.Large de 160 GB o 0,85 USD por hora para nodos DS2.XLarge de 2 TB. Con las instancias reservadas con pago parcial inicial, puede reducir el precio efectivo a 0,10 USD por hora para los nodos DC1.Large (5 500 USD/TB/año) o a 0,228 USD por hora para nodos DS2.XLarge (999 USD/TB/año). Las consultas de Redshift Spectrum tienen un precio de 5 USD por cada terabyte escaneado de S3. Para obtener más información, consulte la página de precios de Amazon Redshift.

Tolerante a errores

Amazon Redshift presenta varias características que mejoran la fiabilidad del clúster de almacén de datos. Todos los datos escritos en un nodo del clúster se replican automáticamente en los demás nodos del clúster, y se realiza una copia de seguridad automática y constante de todos los datos en Amazon S3. Amazon Redshift monitoriza constantemente el estado del clúster, vuelve a replicar automáticamente los datos desde unidades defectuosas y reemplaza los nodos según proceda.

Backups automatizados

Amazon Redshift realiza backups de los datos en Amazon S3 de forma automática y constante. Almacena sus snapshots durante el tiempo definido por el usuario, que puede ir de 1 a 35 días. Puede realizar snapshots en cualquier momento, que se almacenarán hasta que las elimine expresamente. Amazon Redshift también puede replicar de forma asíncrona las snapshots en S3 en otra región para casos de recuperación de desastres. Después de eliminar un clúster, las snapshots del sistema se eliminan, pero las de usuario siguen disponibles hasta que se eliminan explícitamente.

Restablecimientos rápidos

Puede utilizar cualquier snapshot del sistema o del usuario para restablecer el clúster con la consola de administración de AWS o con las API de Amazon Redshift. El clúster se encuentra disponible en cuanto se restablecen los metadatos del sistema y puede comenzar a ejecutar consultas mientras los datos de usuario se ponen en cola en segundo plano.

Cifrado

Con tan solo ajustar un par de parámetros, puede configurar Amazon Redshift para que utilice SSL para proteger los datos activos y el cifrado AES-256 con aceleración por hardware para los datos inactivos. Si decide habilitar el cifrado de los datos inactivos, todos los datos que se graben en el disco y las backups se cifrarán. De forma predeterminada, Amazon Redshift se encarga de administrar las claves, pero puede optar por administrarlas con módulos de seguridad de hardware (HSM) propios, AWS CloudHSMAWS Key Management Service.

Aislamiento de red

Amazon Redshift le permite configurar las reglas del firewall para controlar el acceso de red al clúster de almacén de datos. Puede ejecutar Amazon Redshift en Amazon VPC) para aislar el clúster de almacenamiento de datos en su propia red virtual y conectarlo a la infraestructura de TI existente empleando conexiones IPsec VPN cifradas estándar del sector.

Auditoría y conformidad

Amazon Redshift se integra con AWS CloudTrail para que pueda auditar todas las llamadas a las API de Redshift. Amazon Redshift también registra todas las operaciones SQL, como los intentos de conexión, las consultas y los cambios realizados en la base de datos. Puede obtener acceso a estos logs mediante la realización de consultas SQL en las tablas del sistema u optar por descargarlos en una ubicación segura de Amazon S3. Amazon Redshift cumple los requisitos SOC 1, SOC 2, SOC 3 y PCI DSS de nivel 1. Para obtener más información, visite Conformidad en la nube de AWS.

440x220_APN-Blog

Amazon Redshift Spectrum permite extender el poder analítico de Amazon Redshift más allá de los datos almacenados en discos locales en su almacén de datos, lo que permite consultar grandes cantidades de datos en el "mar de datos" de Amazon S3, sin tener que cargar ni transformar ningún dato. En esta publicación de blog, hemos recopilado las 10 prácticas recomendadas para más importantes para Amazon Redshift Spectrum, y las hemos agrupado en diversas categorías funcionales.

Lea la publicación completa »

Con Amazon Redshift Spectrum, los clientes de Amazon Redshift pueden consultar fácilmente sus datos en Amazon S3. Redshift Spectrum trabaja directamente con los datos de origen en su formato nativo (entre otros, Avro, CSV, Grok, ORC, Parquet, RCFile, RegexSerDe, SequenceFile, TextFile y TSV). Esto significa que no es necesario cargar ni transformar los datos.

Lea la publicación completa »

Con el fin de permitirle procesar datos tal y como son, y donde están, mientras aprovecha la potencia y flexibilidad de Amazon Redshift, lanzamos Amazon Redshift Spectrum. Puede usar Spectrum para ejecutar consultas complejas sobre datos almacenados en Amazon Simple Storage Service (S3), sin necesidad de cargarlos u otro tipo de preparación de datos.

Lea la publicación completa »

La compresión en columnas es una tecnología importante en Amazon Redshift. Esto permite una reducción de los costos de clientes al aumentar la capacidad de almacenamiento efectiva de nuestros nodos y mejora el desempeño al reducir las E/S necesarias para procesar las solicitudes de SQL. La mejora de la eficiencia de E/S es muy importante para el almacenamiento de datos. El año pasado, nuestras mejoras de E/S duplicaron el desempeño de las consultas. Hablemos de algunas de las nuevas mejoras de compresión que hemos añadido recientemente a Amazon Redshift.

Lea la publicación completa »

Para ver una lista completa de publicaciones del blog relacionadas con Amazon Redshift, consulte la página de publicaciones del blog »

Pruebe Amazon Redshift de forma gratuita. Obtenga 750 horas gratis de DC1.Large al mes durante un periodo de dos meses. Para comenzar la prueba gratuita, cree una cuenta de AWS e inicie sesión en la consola de Amazon Redshift. A continuación, lance un clúster de Amazon Redshift y seleccione DC1.Large como tipo de nodo. Para solicitar soporte para su prueba de concepto o evaluación, haga clic aquí.

 

Comience ahora