La nube de AWS
La nube de AWS
Comenzar prueba gratuita

Amazon Redshift es un almacén de datos rápido y totalmente administrado a escala de petabytes que permite analizar todos los datos empleando de forma sencilla y rentable las herramientas de inteligencia empresarial existentes. Comience con poca capacidad por 0,25 USD por hora sin asumir ningún compromiso y escale hasta varios petabytes por 1 000 USD por terabyte al año, menos de la décima parte del costo de las soluciones tradicionales. Por lo general, los clientes se benefician del triple de compresión, lo que reduce sus costos a 333 USD por terabyte sin comprimir al año.

Desempeño rápido y constante

Rapidez

Amazon Redshift ofrece un desempeño de consulta rápido gracias a la utilización de la tecnología de almacenamiento en columnas para mejorar la eficacia de E/S y realizar consultas en paralelo entre varios nodos. La velocidad de carga de los datos aumenta de manera lineal con respecto al tamaño del clúster, con integraciones en Amazon S3, Amazon DynamoDB, Amazon Elastic MapReduce, Amazon Kinesis o en cualquier otro host con SSH habilitado.

Gran escalabilidad

Rentabilidad

Solo paga por lo que utiliza. Puede tener una cantidad ilimitada de usuarios realizando tareas ilimitadas de análisis por tan solo 1 000 USD por terabyte al año, lo que supone una 10.a parte del costo de otras soluciones de almacenamiento de datos tradicionales.

Flexible

Sencillez

Amazon Redshift le permite automatizar con facilidad la mayoría de las tareas administrativas para administrar, monitorizar y escalar el almacén de datos. Con la administración de todas estas tareas que tanto trabajo y tiempo requieren, Amazon Redshift lo libera de ellas para que pueda dedicarse a los datos y a los aspectos empresariales.

Programación dirigida por eventos

Elasticidad

También puede modificar el tamaño del clúster con facilidad a medida que cambien sus necesidades de desempeño y capacidad con tan solo unos clics en la consola o mediante una sencilla llamada a la API.

 

Control de acceso minucioso

Seguridad

La seguridad está integrada. Puede cifrar los datos en reposo y en tránsito con AES-256 acelerado por hardware y SSL, aislar los clústeres con Amazon VPC e incluso administrar las claves mediante AWS Key Management Service (KMS) y módulos de seguridad de hardware (HSM).

Totalmente administrado

Compatibilidad

Amazon Redshift admite SQL estándar y proporciona complementos personalizados para JDBC y ODBC que se descargan de la consola, por lo que puede utilizar una amplia variedad de clientes SQL populares. También puede utilizar controladores JDBC y ODBC PostgreSQL estándar.

Almacenamiento de datos optimizado

Amazon Redshift utiliza una serie de innovaciones para obtener un desempeño muy alto de consulta en conjuntos de datos con una capacidad que oscila entre cien gigabytes y un petabyte o incluso más. Utiliza un almacenamiento en columna, compresión de datos y asignaciones de zona para reducir la cantidad de E/S necesaria para realizar consultas. Amazon Redshift cuenta con una arquitectura de almacenamiento de datos de procesamiento paralelo de forma masiva (MPP), que paraleliza y distribuye operaciones SQL para que pueda beneficiarse de todos los recursos disponibles. El hardware subyacente se ha diseñado para un procesamiento de datos de alto desempeño. Utiliza un almacenamiento conectado local para maximizar el desempeño entre las unidades y las CPU y una red de maya de 10 GigE para maximizar el desempeño entre los nodos.

 

Escala de petabytes

Con tan solo unos clics en la consola o una sencilla llamada a la API, puede cambiar con facilidad la cantidad o el tipo de nodos del almacén de datos y escalar hasta alcanzar un petabyte o más de datos de usuario comprimidos. Los nodos de almacenamiento denso (DS) le permiten crear almacenes de datos muy grandes con unidades de disco duro (HDD) por un precio muy bajo. Los nodos de informática densa (DC) le permiten crear almacenes de datos de desempeño muy elevado con CPU rápidas, grandes cantidades de RAM y discos de estado sólido (SSD). Mientras se modifica el tamaño, Amazon Redshift le permite seguir realizando consultas en su almacén de datos en modo de solo lectura hasta que el nuevo clúster esté totalmente aprovisionado y listo para su uso.

Sin costos iniciales

Solo tendrá que pagar por la capacidad que aprovisione. Puede elegir precios de instancias bajo demanda sin costos iniciales ni compromisos a largo plazo o bien beneficiarse de tarifas significativamente reducidas con los precios aplicables a las instancias reservadas. Los precios bajo demanda comienzan desde tan solo 0,25 USD por hora para nodos DC1.Large de 160 GB o 0,85 USD por hora para nodos DS2.XLarge de 2 TB. Con las instancias reservadas con pago parcial inicial, puede reducir el precio efectivo a 0,10 USD por hora para los nodos DC1.Large (5 500 USD/TB/año) o a 0,228 USD por hora para nodos DS2.XLarge (999 USD/TB/año). Para obtener más información, consulte la página de precios de Amazon Redshift.

Tolerante a errores

Amazon Redshift presenta varias características que mejoran la fiabilidad del clúster de almacén de datos. Todos los datos escritos en un nodo del clúster se replican automáticamente en los demás nodos del clúster, y se realiza una copia de seguridad automática y constante de todos los datos en Amazon S3. Amazon Redshift monitoriza constantemente el estado del clúster, vuelve a replicar automáticamente los datos desde unidades defectuosas y reemplaza los nodos según proceda.

Backups automatizados

Amazon Redshift realiza backups de los datos en Amazon S3 de forma automática y constante. Almacena sus snapshots durante el tiempo definido por el usuario, que puede ir de 1 a 35 días. Puede realizar snapshots en cualquier momento, que se almacenarán hasta que las elimine expresamente. Amazon Redshift también puede replicar de forma asíncrona las snapshots en S3 en otra región para casos de recuperación de desastres. Después de eliminar un clúster, las snapshots del sistema se eliminan, pero las de usuario siguen disponibles hasta que se eliminan explícitamente.

Restablecimientos rápidos

Puede utilizar cualquier snapshot del sistema o del usuario para restablecer el clúster con la consola de administración de AWS o con las API de Amazon Redshift. El clúster se encuentra disponible en cuanto se restablecen los metadatos del sistema y puede comenzar a ejecutar consultas mientras los datos de usuario se ponen en cola en segundo plano.

Cifrado

Con tan solo ajustar un par de parámetros, puede configurar Amazon Redshift para que utilice SSL para proteger los datos activos y el cifrado AES-256 con aceleración por hardware para los datos inactivos. Si decide habilitar el cifrado de los datos inactivos, todos los datos que se graben en el disco y las backups se cifrarán. De forma predeterminada, Amazon Redshift se encarga de administrar las claves, pero puede optar por administrarlas con módulos de seguridad de hardware (HSM) propios, AWS CloudHSMAWS Key Management Service.

Aislamiento de red

Amazon Redshift le permite configurar las reglas del firewall para controlar el acceso de red al clúster de almacén de datos. Puede ejecutar Amazon Redshift en Amazon VPC) para aislar el clúster de almacenamiento de datos en su propia red virtual y conectarlo a la infraestructura de TI existente empleando conexiones IPsec VPN cifradas estándar del sector.

Auditoría y conformidad

Amazon Redshift se integra con AWS CloudTrail para que pueda auditar todas las llamadas a las API de Redshift. Amazon Redshift también registra todas las operaciones SQL, como los intentos de conexión, las consultas y los cambios realizados en la base de datos. Puede obtener acceso a estos logs mediante la realización de consultas SQL en las tablas del sistema u optar por descargarlos en una ubicación segura de Amazon S3. Amazon Redshift cumple los requisitos SOC 1, SOC 2, SOC 3 y PCI DSS de nivel 1. Para obtener más información, visite Conformidad en la nube de AWS.

440x220_APN-Blog

Publicar comparaciones de desempeño confusas es una táctica de marketing clásica de compañías antiguas. No es de extrañar que compañías antiguas (como Oracle) utilicen esta táctica, pero nos sorprendió ver que Google también había recurrido a ella. Cuando Google presentó los resultados de su comparación entre BigQuery y Amazon Redshift benchmark en un evento privado en San Francisco el 29 de septiembre de 2016, nos despertó la curiosidad y decidimos investigar el asunto a fondo.

Lea la publicación completa »

En esta publicación, Periscope presenta los resultados de su estudio comparativo de Amazon Redshift, Snowflake y Google BigQuery.

Lea la publicación completa »

Muchos clientes de AWS nos han pedido una manera de analizar de forma programática sus informes de costos y uso. Con frecuencia, estos clientes utilizan AWS para ejecutar varios aspectos del negocio, usando una gran variedad de servicios, a menudo repartidos entre varias regiones. Pero como proporcionamos información sobre facturación y costos más detallada, esto da lugar a un problema de big data, ¡uno que puede resolverse fácilmente con los servicios de AWS! Mientras estaba de vacaciones este mes, se lanzó una nueva característica que le permite cargar sus informes de costos y uso a Amazon Redshift y Amazon QuickSight. Y ahora que me he puesto al día, me gustaría hablarles de esta característica.

Lea la publicación completa »

Para ver una lista completa de publicaciones del blog relacionadas con Amazon Redshift, consulte la página de publicaciones del blog »

Para obtener información sobre todas las características nuevas de Amazon Redshift, consulte la página de novedades »

Pruebe Amazon Redshift de forma gratuita. Obtenga 750 horas gratis de DC1.Large al mes durante un periodo de dos meses. Para comenzar la prueba gratuita, cree una cuenta de AWS e inicie sesión en la consola de Amazon Redshift. A continuación, lance un clúster de Amazon Redshift y seleccione DC1.Large como tipo de nodo.

 

Comience ahora