Amazon Redshift Spectrum permite ejecutar consultas SQL de Amazon Redshift sobre exabytes de datos en Amazon S3. Con Redshift Spectrum, puede extender el poder analítico de Amazon Redshift más allá de los datos almacenados en discos locales en su almacén de datos, lo que permite consultar grandes cantidades de datos no estructurados en el "mar de datos" de Amazon S3, sin tener que cargar ni transformar ningún dato. Redshift Spectrum aplica una sofisticada optimización de consultas y escala el procesamiento a través de miles de nodos para que los resultados sean rápidos, incluso con grandes conjuntos de datos y consultas complejas.

Redshift Spectrum consulta los datos directamente en Amazon S3 utilizando los formatos de datos abiertos que ya conoce, entre otros, Avro, CSV, Grok, ORC, Parquet, RCFile, RegexSerDe, SequenceFile, TextFile y TSV. Dado que Redshift Spectrum soporta la misma sintaxis SQL de Amazon Redshift, puede ejecutar sofisticadas consultas utilizando las mismas herramientas de Business Intelligence (BI) que usa en la actualidad. También puede ejecutar consultas que abarquen tanto los datos de acceso frecuente almacenados de forma local en Amazon Redshift como sus conjuntos de datos completos almacenados de manera rentable en Amazon S3.

Redshift Spectrum ofrece la libertad de almacenar los datos donde desee, en el formato que quiera y de forma que se encuentren disponibles para procesarlos cuando lo necesite. No hay pagos iniciales ni compromisos con Redshift Spectrum. Solo paga por las consultas ejecutadas.

¿Listo para comenzar a realizar consultas?

Introducción a Amazon Redshift
Dory_Feature_Start_Querying_Instantly

Con Amazon Redshift Spectrum puede empezar a consultar los datos en Amazon S3 de inmediato, sin necesidad de carga o transformación. Solo necesita registrar su catálogo de datos de Amazon Athena, AWS Glue o Apache Hive Metastore como un esquema externo. Puede utilizar el mismo SQL que utiliza para consultar las tablas de Amazon Redshift y cualquier herramienta de BI que admita Redshift en la actualidad.

Dory_Feature_Fast_Performance

Amazon Redshift ofrece un desempeño ultra rápido, ya sea para análisis ad-hoc en grandes conjuntos de datos no estructurados en Amazon S3 o para análisis frecuentes en conjuntos de datos estructurados en las tablas de Redshift. Puede mantener los datos utilizados con más frecuencia en los clústeres de Redshift de Amazon para beneficiarse del desempeño de los discos locales y utilizar Amazon Redshift Spectrum para extender sus consultas a datos utilizados con menor frecuencia almacenados en Amazon S3 para obtener una escalabilidad ilimitada y bajo costo. El optimizador de consultas de Amazon Redshift determinará automáticamente cómo minimizar los datos escaneados en Amazon S3 y el número de nodos de Redshift Spectrum que se utilizarán en la consulta.

Dory_Feature_Scalable

Con Amazon Redshift Spectrum no tiene que preocuparse por escalar el clúster. Permite separar el almacenamiento de la computación, por lo que puede escalar cada función de forma independiente. Incluso puede ejecutar varios clústeres de Amazon Redshift contra el mismo mar de datos de Amazon S3, lo que permite una concurrencia ilimitada. Redshift Spectrum escala automáticamente a miles de instancias si es necesario, por lo que las consultas se ejecutan rápidamente, ya sea procesando un terabyte, un petabyte o un exabyte.

Dory_Feature_Pay_per_query

Con Amazon Redshift Spectrum, solo paga por las consultas que ejecuta. Tiene que pagar 5 $ por terabyte de datos procesados para ejecutar la consulta. Redshift Spectrum puede consultar datos comprimidos. Puede ahorrar entre un 30% y un 90% en los costos por consulta y mejorar el desempeño mediante la compresión, la partición y la conversión de datos en un formato de columnas. No hay cargos por Redshift Spectrum cuando no se ejecutan consultas. Se pagan las tarifas estándar de Amazon S3 por el almacenamiento de datos y las tasas de instancia de Amazon Redshift por los clústeres utilizados.