Amazon Redshift es un almacén de datos rápido y totalmente administrado a escala de petabytes que permite analizar todos los datos empleando de forma sencilla y rentable las herramientas de inteligencia empresarial existentes. Comience con poca capacidad por 0,25 USD por hora sin asumir ningún compromiso y escale hasta varios petabytes por 1 000 USD por terabyte al año, menos de la décima parte del costo de las soluciones tradicionales. Por lo general, los clientes se benefician del triple de compresión, lo que reduce sus costos a 333 USD por terabyte sin comprimir al año.

Pruebe Amazon Redshift de forma gratuita

Comenzar prueba gratuita
Más información

Obtenga 750 horas gratis de DC1.Large al mes durante un periodo de dos meses.  Para iniciar la prueba:

Cree una cuenta de AWS e inicie sesión en la consola de Amazon Redshift

Lance un clúster de Amazon Redshift y seleccione DC1.Large como tipo de nodo.

Registre e incorpore datos de forma gratuita con las pruebas gratuitas para socios




Amazon Redshift ofrece un desempeño de consulta rápido gracias a la utilización de la tecnología de almacenamiento en columnas para mejorar la eficacia de E/S y realizar consultas en paralelo entre varios nodos. Amazon Redshift dispone de controladores JDBC y ODBC personalizados que puede descargar desde la pestaña Connect Client de nuestra consola y que le permiten utilizar una amplia gama de clientes SQL. También puede utilizar controladores JDBC y ODBC PostgreSQL estándar. La velocidad de carga de los datos aumenta de manera lineal con respecto al tamaño del clúster, con integraciones en Amazon S3, Amazon DynamoDB, Amazon Elastic MapReduce, Amazon Kinesis o en cualquier otro host con SSH habilitado.

La arquitectura de almacenamiento de datos de Amazon Redshift le permite automatizar la mayoría de las tareas administrativas asociadas con el aprovisionamiento, la configuración y la monitorización de un almacén de datos en la nube. Los backups en Amazon S3 son constantes, incrementales y automáticos. Los restablecimientos son rápidos; puede comenzar a consultar en cuestión de minutos mientras los datos se agrupan en segundo plano. Habilitar la recuperación de desastres entre regiones es una tarea que solo requiere unos cuantos clics.

La seguridad está integrada. Puede cifrar los datos en reposo y en tránsito con AES-256 acelerado por hardware y SSL, aislar los clústeres con Amazon VPC e incluso administrar las claves mediante AWS Key Management Service (KMS) y módulos de seguridad de hardware (HSM). Se realiza un log y una auditoría de todas las llamadas a las API, los intentos de conexión, las consultas y los cambios del clúster. Puede usar AWS CloudTrail para realizar una auditoría de las llamadas al API de Redshift.

Amazon Redshift utiliza una serie de innovaciones para obtener un desempeño muy alto de consulta en conjuntos de datos con una capacidad que oscila entre cien gigabytes y un petabyte o incluso más. Utiliza un almacenamiento en columna, compresión de datos y asignaciones de zona para reducir la cantidad de E/S necesaria para realizar consultas. Amazon Redshift cuenta con una arquitectura de almacenamiento de datos de procesamiento paralelo de forma masiva (MPP), que paraleliza y distribuye operaciones SQL para que pueda beneficiarse de todos los recursos disponibles. El hardware subyacente se ha diseñado para un procesamiento de datos de alto desempeño. Utiliza un almacenamiento conectado local para maximizar el desempeño entre las unidades y las CPU y una red de maya de 10 GigE para maximizar el desempeño entre los nodos.

Con tan solo unos clics en la consola de administración de AWS o con una sencilla llamada a un API, puede cambiar fácilmente el número o el tipo de nodos del almacén de datos en la nube a medida que cambian las necesidades de desempeño o capacidad. Los nodos de almacenamiento denso (DS) le permiten crear almacenes de datos muy grandes con unidades de disco duro (HDD) por un precio muy bajo. Los nodos de informática densa (DC) le permiten crear almacenes de datos de desempeño muy elevado con CPU rápidas, grandes cantidades de RAM y discos de estado sólido (SSD). Amazon Redshift le permite comenzar con un único nodo DC1.Large de 160 GB y, posteriormente, escalar a un petabyte o más de datos de usuario comprimidos mediante la utilización de nodos DS2.8XLarge de 16 TB. A medida que se adapte el tamaño, Amazon Redshift activará el modo de solo lectura en el clúster existente, aprovisionará un clúster nuevo del tamaño que desee y, a continuación, realizará copias paralelas en el nuevo clúster de los datos del clúster anterior. Puede seguir ejecutando consultas en el clúster antiguo mientras el nuevo se aprovisiona. Después de que los datos se hayan copiado al nuevo clúster, Amazon Redshift redirigirá las consultas automáticamente al nuevo clúster y eliminará el clúster anterior.

Solo tendrá que pagar por la capacidad que aprovisione. Puede elegir precios de instancias bajo demanda sin costos iniciales ni compromisos a largo plazo o bien beneficiarse de tarifas significativamente reducidas con los precios aplicables a las instancias reservadas. Los precios bajo demanda comienzan desde tan solo 0,25 USD por hora para nodos DC1.Large de 160 GB o 0,85 USD por hora para nodos DS2.XLarge de 2 TB. Con las instancias reservadas con pago parcial inicial, puede reducir el precio efectivo a 0,10 USD por hora para los nodos DC1.Large (5 500 USD/TB/año) o a 0,228 USD por hora para nodos DS2.XLarge (999 USD/TB/año). Encontrará más detalles en la página de precios de Amazon Redshift.

Con tan solo unos clics en la consola de administración de AWS o sencillas llamadas al API, puede crear un clúster y especificar su tamaño, el tipo de nodo subyacente y el perfil de seguridad. Amazon Redshift aprovisiona los nodos, configura las conexiones entre ellos y protege el clúster. El almacén de datos debe comenzar a funcionar en pocos minutos.

Amazon Redshift procesa todo el trabajo necesario para administrar, monitorizar y escalar el almacén de datos, desde la monitorización del estado del clúster y la realización de backups hasta la aplicación de parches y actualizaciones. A medida que sus necesidades de desempeño y capacidad cambien, podrá cambiar el tamaño de su clúster fácilmente. Con la administración de todas estas tareas que tanto trabajo y tiempo requieren, Amazon Redshift lo libera de ellas para que pueda dedicarse a los datos y a los aspectos empresariales.

Amazon Redshift presenta varias características que mejoran la fiabilidad del clúster de almacén de datos. Todos los datos escritos en un nodo del clúster se replican automáticamente en los demás nodos del clúster y se realiza una copia de seguridad automática y constante de todos los datos en Amazon S3. Amazon Redshift monitoriza constantemente el estado del clúster, vuelve a replicar automáticamente los datos desde unidades defectuosas y reemplaza los nodos según proceda.

La características de snapshots automatizadas de Amazon Redshift realiza copias de seguridad constantemente de los nuevos datos del clúster en Amazon S3. Las snapshots son constantes, incrementales y automáticas. Amazon Redshift almacena las snapshots durante periodos definidos por el usuario, que pueden ser de 1 a 35 días. También puede hacer sus propias snapshots cuando lo desee, para lo que se sirve de las snapshots existentes en el sistema y, además, se conservan hasta que las elimine explícitamente. Redshift también puede replicar de forma asíncrona las snapshots en S3 en otra región para casos de recuperación de desastres. Después de eliminar un clúster, las snapshots del sistema se eliminan, pero las de usuario siguen disponibles hasta que se eliminan explícitamente.

Puede utilizar cualquier snapshot del sistema o del usuario para restablecer el clúster con la consola de administración de AWS o con las API de Amazon Redshift. El clúster se encuentra disponible en cuanto se restablecen los metadatos del sistema y puede comenzar a ejecutar consultas mientras los datos de usuario se ponen en cola en segundo plano.

Con tan solo ajustar un par de parámetros, puede configurar Amazon Redshift para que utilice SSL para proteger los datos activos y el cifrado AES-256 con aceleración por hardware para los datos inactivos. Si decide habilitar el cifrado de los datos inactivos, todos los datos que se graben en el disco y las backups se cifrarán. De forma predeterminada, Amazon Redshift se encarga de administrar las claves, pero puede optar por administrarlas con módulos de seguridad de hardware (HSM) propios, AWS CloudHSMAWS Key Management Service.

Amazon Redshift le permite configurar las reglas del firewall para controlar el acceso de red al clúster de almacén de datos. Puede ejecutar Amazon Redshift en Amazon Virtual Private Cloud (Amazon VPC) para aislar el clúster de almacenamiento de datos en su propia red virtual y conectarlo a la infraestructura de TI existente empleando conexiones IPsec VPN cifradas estándar del sector.

Amazon Redshift se integra con AWS CloudTrail para que pueda auditar todas las llamadas a las API de Redshift. Amazon Redshift también registra todas las operaciones SQL, como los intentos de conexión, las consultas y los cambios realizados en la base de datos. Puede obtener acceso a estos logs mediante la realización de consultas SQL en las tablas del sistema u optar por descargarlos en una ubicación segura de Amazon S3. Amazon Redshift cumple los requisitos SOC 1, SOC 2, SOC 3 y PCI DSS de nivel 1. Para obtener más detalles, visite el Centro de conformidad de AWS.

Amazon Redshift es una solución de almacén de datos SQL y utiliza las conexiones estándar del sector ODBC y JDBC. Puede descargar nuestros controladores JDBC y ODBC personalizados desde la pestaña Connect Client de nuestra consola. Muchos proveedores populares de software han certificado Amazon Redshift con sus ofertas para permitirle seguir utilizando las herramientas que utiliza hoy en día. Consulte la página de socios de Amazon Redshift para obtener información detallada.

Amazon Redshift está integrado con otros servicios de AWS e incorpora comandos para cargar datos en paralelo en cada nodo de Amazon S3, Amazon DynamoDB o en los servidores de EC2 y on-premise con la utilización de SSH. AWS Data PipelineAmazon Kinesis y AWS Lambda se integran con Amazon Redshift como un destino de datos. También puede cargar datos de streaming en Amazon Redshift con Amazon Kinesis Firehose.