- Análisis›
- Amazon Redshift›
- Características de Amazon Redshift
Capacidades de Amazon Redshift
Almacenamiento de datos en la nube moderno, escalable, seguro y de alto rendimiento para analizar todos sus datos.Análisis de todos los datos
Aspectos generales
Obtenga información integrada mediante la ejecución de análisis predictivos y en tiempo real sobre datos complejos y escalados en sus bases de datos operativas, lagos de datos, almacenamientos de datos y miles de conjuntos de datos de terceros.
Consulta federada: con la nueva capacidad de consulta federada de Amazon Redshift, puede trabajar con su base de datos relacional operativa. Realice consultas de datos en directo en una o más bases de datos de Amazon Relational Database Service (RDS), Aurora PostgreSQL, RDS MySQL y Aurora MySQL para obtener una visibilidad instantánea de las operaciones empresariales integrales, sin la necesidad de trasladar datos. Puede combinar datos de los almacenamientos de datos de Redshift, de un lago de datos y de los almacenes operativos, para tomar mejores decisiones basadas en los datos. Amazon Redshift ofrece optimizaciones para reducir el movimiento de datos en la red y las complementa con un procesamiento masivo de datos en paralelo para lograr consultas de alto rendimiento. Más información
Uso compartido: el uso compartido de datos de Amazon Redshift permite extender la facilidad de uso, el rendimiento y los beneficios en materia de costos que ofrece Amazon Redshift desde un solo clúster hasta despliegues de varios clústeres, a la vez que se pueden compartir los datos. El uso compartido de datos permite el acceso instantáneo, rápido y pormenorizado a los datos en todos los clústeres de Redshift, sin necesidad de copiarlos ni trasladarlos. El uso compartido de datos proporciona acceso en directo a los datos para que los usuarios siempre vean la información más actualizada y coherente a medida que se actualiza en el almacenamiento de datos. Puede compartir datos en directo de forma segura con los clústeres de Redshift que se encuentren en la misma cuenta de AWS o en cuentas diferentes y entre regiones. Más información
AWS Data Exchange para Amazon Redshift: consulte los conjuntos de datos de Amazon Redshift desde su propio clúster de Redshift sin necesidad de extracción, transformación y carga (ETL) de los datos. Puede suscribirse a los productos de almacenamiento de datos en la nube de Redshift en AWS Data Exchange. Apenas un proveedor efectúa una actualización, los suscriptores pueden ver el cambio. Si es un proveedor de datos, el acceso se otorga automáticamente cuando comienza la suscripción y se revoca cuando finaliza. Las facturas se generan de forma automática cuando vencen los pagos y estos se cobran a través de AWS. Puede autorizar el acceso a los archivos sin formato, los datos de Amazon Redshift y los datos entregados a través de las API, todo con una sola suscripción. Más información
Machine Learning de Redshift: el ML de Redshift facilita a los analistas de datos, los científicos de datos, los profesionales de BI y los desarrolladores la creación, la formación y la implementación de modelos de Amazon SageMaker mediante SQL. Con el machine learning de Redshift, puede utilizar instrucciones SQL para crear y formar modelos de Amazon SageMaker a partir de los datos de Amazon Redshift y, luego, utilizar esos modelos para hacer predicciones, como la detección de la deserción de clientes, los pronósticos financieros, la personalización y la puntuación de riesgos directamente en sus consultas e informes. Más información
Integración de Amazon Redshift para Apache Spark: esta característica facilita la creación y ejecución de aplicaciones de Apache Spark con datos de Amazon Redshift, lo que permite a los clientes ampliar el almacenamiento de datos para funcionar con un conjunto más amplio de soluciones de análisis y machine learning. Con la integración de Amazon Redshift para Apache Spark, los desarrolladores que utilizan análisis de AWS y servicios de ML como Amazon EMR, AWS Glue, Amazon Athena Spark y Amazon SageMaker pueden comenzar en segundos, y crear sin esfuerzo aplicaciones de Apache Spark que lean y escriban en su almacenamiento de datos de Amazon Redshift sin afectar el rendimiento de sus aplicaciones ni la coherencia transaccional de sus datos. La integración de Amazon Redshift para Spark también hace más fácil supervisar y solucionar errores de rendimiento de aplicaciones de Apache Spark cuando se utiliza con Amazon Redshift.
Integración de Amazon Aurora con Amazon Redshift sin ETL: una integración sin código entre Amazon Aurora y Amazon Redshift que permite a los clientes de Amazon Aurora utilizar Amazon Redshift para realizar análisis en tiempo y real y usar machine learning con petabytes de datos transaccionales. En cuestión de segundos, Amazon Aurora con Amazon Redshift sin ETL hace que los datos transaccionales que se han escrito en Amazon Aurora están disponibles de manera integral en Amazon Redshift, lo que elimina la necesidad de que los clientes creen y mantengan canalizaciones de datos complejas para realizar operaciones de extracción, transformación y carga (ETL). Esta integración reduce la carga operativa y los costos, y permite a los clientes centrarse en mejorar sus aplicaciones. Con acceso casi en tiempo real a los datos transaccionales, los clientes pueden beneficiarse de las capacidades de análisis y machine learning de Amazon Redshift para obtener información de los datos transaccionales, y otros datos, y así responder de manera eficaz a eventos críticos y sensibles al tiempo.
Ingesta de streaming: ingenieros de datos, analistas de datos y desarrolladores de macrodatos están utilizando motores de streaming en tiempo real para mejorar la capacidad de respuesta de los clientes. Con la nueva capacidad de ingesta de streaming en Amazon Redshift, puede utilizar SQL (Structured Query Language) para brindar la capacidad de conectarse e ingerir directamente a partir de Amazon Kinesis Data Streams y Amazon Managed Streaming para Apache Kafka (MSK). La ingesta de streaming de Amazon Redshift simplifica las canalizaciones de datos al permitirle crear vistas materializadas sobre los flujos directamente. Las vistas materializadas también pueden incluir transformaciones SQL como parte de la canalización ELT (Extract Load Transform). Puede actualizar de manera manual vistas materializadas definidas para consultar los datos de streaming más recientes. Este enfoque le permite realizar el procesamiento posterior y las transformaciones de los datos de streaming utilizando las herramientas existentes con las que está familiarizado, sin costo adicional.
Consulta de los datos y exportación desde y hacia un lago de datos: ningún otro almacenamiento de datos en la nube facilita tanto la consulta de los datos y su escritura de vuelta en el lago de datos en formatos abiertos. Puede realizar consultas en formatos de archivo abiertos, como Parquet, ORC, JSON, Avro, CSV y más directamente en Amazon S3 mediante el uso del conocido SQL ANSI. Para exportar datos a un lago de datos, tan solo debe utilizar el comando UNLOAD de Amazon Redshift en el código SQL y especificar Parquet como el formato de archivo. Amazon Redshift se encargará automáticamente de darle formato a los datos y de migrarlos a S3. Esto le da la flexibilidad para almacenar datos con un alto nivel de estructuración a los que se accede con frecuencia y datos semiestructurados en un almacenamiento de datos de Amazon Redshift y, al mismo tiempo, conservar exabytes de datos estructurados, semiestructurados y no estructurados en Amazon S3. Exportar datos desde Amazon Redshift de regreso a un lago de datos le permite analizar los datos en mayor medida con servicios de AWS como Amazon Athena, Amazon EMR y Amazon SageMaker.
Integración con los servicios de AWS: la integración nativa con los servicios de AWS, los servicios de bases de datos y de machine learning facilita la gestión de flujos de trabajo completos de análisis sin fricción. Por ejemplo, AWS Lake Formation es un servicio que facilita la configuración de un lago de datos seguro en cuestión de días. AWS Glue puede extraer datos de Amazon Redshift, transformarlos y cargarlos (ETL) también en dicho servicio. Amazon Kinesis Data Firehose es la forma más sencilla de registrar, transformar y cargar datos de streaming en Amazon Redshift para realizar análisis casi en tiempo real. Puede utilizar Amazon EMR para procesar datos con Hadoop/Spark y cargar el resultado en Amazon Redshift para tareas de inteligencia empresarial y análisis. Amazon QuickSight es el primer servicio de inteligencia empresarial con precios de pago por sesión que puede utilizar para crear informes, visualizaciones y paneles referidos a los datos de Redshift. Puede utilizar Amazon Redshift para preparar sus datos con el fin de ejecutar cargas de trabajo de machine learning (ML) con Amazon SageMaker. Para agilizar las migraciones a Amazon Redshift, puede utilizar AWS Schema Conversion Tool y AWS Database Migration Service (DMS). Amazon Redshift también está altamente integrado a Amazon Key Management Service (KMS) y Amazon CloudWatch para asuntos de seguridad, monitoreo y conformidad. También puede utilizar las funciones definidas por el usuario (UDF) de Lambda para invocar una función de Lambda desde sus consultas de SQL como si invocara una función definida por el usuario en Amazon Redshift. Puede escribir UDF de Lambda para integrarse a servicios de los socios de AWS y acceder a otros servicios populares de AWS, como Amazon DynamoDB y Amazon SageMaker.
Integración de la consola de socios: puede acelerar la incorporación de datos y crear información empresarial valiosa en minutos mediante la integración a soluciones de socios selectos en la consola de Amazon Redshift. Con estas soluciones, puede incorporar datos desde aplicaciones como Salesforce, Google Analytics, Facebook Ads, Slack, Jira, Splunk y Marketo a su almacenamiento de datos de Redshift de forma eficiente y optimizada. También le permite unir estos conjuntos de datos dispares y analizarlos juntos para producir información procesable.
Copia automática desde Amazon S3: Amazon Redshift admite la copia automática para simplificar y automatizar la carga de datos desde Amazon S3, y reduce el tiempo y el esfuerzo necesarios para crear soluciones personalizadas o administrar servicios de terceros. Con esta característica, Amazon Redshift elimina la necesidad de ejecutar de manera manual y repetida procedimientos de copia al automatizar la ingesta de archivos y encargarse de los pasos de carga de datos continua entre bastidores. La compatibilidad con la copia automática hace que para los usuarios de líneas de negocios y analistas de datos sin conocimientos de ingeniería de datos sea más fácil crear reglas de ingesta y configura la ubicación de los datos que desean cargar desde Amazon S3. A medida que los datos nuevos llegan a las carpetas de Amazon S3 especificadas, el proceso de ingesta se desencadena de forma automática según las configuraciones definidas por los usuarios. Todos los formatos de archivo son compatibles con el comando de copia de Redshift, incluidos CSV, JSON, Parquet y Avro.
Soporte nativo para análisis avanzado: Amazon Redshift admite tipos estándar de datos escalares como NUMBER, VARCHAR y DATETIME, y brinda soporte nativo para los siguientes tipos de procesamiento de análisis avanzado:
- Procesamiento de datos espaciales: Amazon Redshift ofrece un tipo de datos polimórfico, GEOMETRY, que admite varias formas geométricas, como Point, Linestring y Polygon. Amazon Redshift también proporciona funciones espaciales de SQL para crear formas geométricas, así como para importar, exportar y procesar datos espaciales y poder acceder a ellos. Puede agregar columnas de GEOMETRY a las tablas de Redshift y escribir consultas en SQL en datos espaciales y no espaciales. Esta capacidad le permite almacenar, recuperar y procesar datos espaciales y mejorar sin dificultades la información empresarial mediante la integración de los datos espaciales en sus consultas analíticas. Gracias a la capacidad de Amazon Redshift de consultar los lagos de datos sin inconvenientes, también puede extender fácilmente el procesamiento espacial a los lagos de datos mediante la integración de tablas externas a las consultas espaciales. Para obtener más información, consulte la documentación.
- Boceto de HyperLogLog: HyperLogLog es un algoritmo nuevo que calcula de forma eficaz la cantidad aproximada de valores distintos en un conjunto de datos. Un boceto de HLL es una construcción que encapsula la información sobre los valores distintos en el conjunto de datos. Puede utilizar bocetos de HLL para lograr obtener beneficios de rendimiento significativos en consultas que calculan la cardinalidad aproximada de grandes conjuntos de datos, con un promedio de error relativo entre el 0,01 y el 0,6 %. Amazon Redshift proporciona un tipo de datos de primera clase, HLLSKETCH, y funciones de SQL asociadas para generar, conservar y combinar bocetos de HyperLogLog. La capacidad HyperLogLog de Amazon Redshift utiliza técnicas de corrección de sesgo y proporciona precisión elevada con poca capacidad de memoria. Para obtener más información, consulte la documentación.
- Tipos de datos DATE y TIME: Amazon Redshift proporciona múltiples tipos de datos: DATE, TIME, TIMETZ, TIMESTAMP y TIMESTAMPTZ para almacenar y procesar de forma nativa datos de fecha y hora. Los tipos TIME y TIMESTAMP almacenan los datos de la hora sin información de la zona horaria, mientras que los tipos TIMETZ y TIMESTAMPTZ almacenan los datos de la hora con la información de la zona horaria. Puede utilizar diversas funciones SQL de fecha/hora para procesar los valores de fecha y hora en consultas de Redshift. Para obtener más información, consulte la documentación.
- Procesamiento de datos semiestructurados: el tipo de datos SUPER de Amazon Redshift almacena de forma nativa JSON y otros datos semiestructurados en tablas de Redshift y utiliza el lenguaje de consultas PartiQL para procesar los datos semiestructurados sin inconvenientes. El tipo de datos SUPER no es de naturaleza esquemática y permite el almacenamiento de valores anidados que podrían contener valores escalares, matrices anidadas y estructuras anidadas de Redshift. PartiQL es una extensión de SQL y brinda capacidades poderosas de consulta, como la navegación de objetos y matrices, la desanidación de matrices, la clasificación dinámica y la semántica sin esquemas. Esto permite lograr un análisis avanzado que combina los datos SQL estructurados clásicos con los datos semiestructurados SUPER con mayor rendimiento, flexibilidad y facilidad de uso. Para obtener más información, consulte la documentación.
- Integración con herramientas de terceros: existen muchas opciones que permiten mejorar las características de Amazon Redshift trabajando con las herramientas y los expertos líderes del sector para cargar, transformar y visualizar datos. Los socios que integran nuestra amplia lista de socios han certificado sus soluciones para que funcionen con Amazon Redshift.
- Cargue y transforme sus datos con los socios de integración de datos.
- Analice datos y comparta información útil en toda la organización con los socios de inteligencia empresarial.
- Diseñe la arquitectura e implemente su plataforma de análisis con los socios consultores y de integración de sistemas.
- Realice consultas, explore y modele los datos con las herramientas y las utilidades de los socios de consulta y modelado de datos.
Relación precio-rendimiento a cualquier escala
Aspectos generales
Obtenga un rendimiento de precios hasta 5 veces mayor al de otros almacenamientos de datos en la nube con optimizaciones automatizadas para mejorar la velocidad de las consultas.
Instancias de RA3: las instancias de RA3 ofrecen un rendimiento de precios hasta 5 veces mayor al de cualquier servicio de almacenamiento de datos en la nube. Estas instancias de Amazon Redshift maximizan la velocidad para cargas de trabajo con rendimiento intensivo que necesitan grandes volúmenes de capacidad informática, con la flexibilidad para pagar la informática y el almacenamiento de forma independiente, mediante la especificación de la cantidad de instancias que necesita. Más información.
Almacenamiento eficiente y procesamiento de consultas de alto rendimiento: Amazon Redshift ofrece un rendimiento de consultas rápido en conjuntos de datos que varían en tamaño desde gigabytes hasta petabytes. El almacenamiento en columnas, la compresión de datos y las asignaciones de zona reducen la cantidad de operaciones de E/S necesarias para realizar consultas. Además de las codificaciones estándar del sector, como LZO y Zstandard, Amazon Redshift también ofrece la codificación de compresión AZ64, elaborada específicamente para los tipos numéricos y de fecha y hora con el fin de proporcionar ahorros en el almacenamiento y rendimiento de consultas optimizado.
Simultaneidad ilimitada: Amazon Redshift proporciona un rendimiento constante y rápido, incluso con miles de consultas simultáneas, ya sea que consulten datos en su almacenamiento de datos de Redshift o directamente en su lago de datos de Amazon S3. El escalamiento de simultaneidad de Amazon Redshift admite consultas y usuarios simultáneos prácticamente ilimitados con niveles de servicio estables mediante la incorporación de capacidad transitoria en segundos a medida que aumenta la simultaneidad. Más información.
Vistas materializadas: las vistas materializadas de Amazon Redshift permiten lograr un rendimiento de consultas notablemente más rápido para las cargas de trabajo analíticas iterativas o predecibles, como la preparación de paneles, las consultas desde herramientas de BI y los trabajos de procesamiento de extract, load and transform (ELT, extraer, cargar y transformar) de datos. Puede utilizar las vistas materializadas para almacenar y administrar con facilidad los resultados precalculados de una instrucción SELECT que pueda hacer referencia a una o más tablas, incluidas tablas externas. Las consultas posteriores que aludan a las vistas materializadas pueden ejecutarse mucho más rápido reutilizando los resultados precalculados. Amazon Redshift puede conservar de forma eficiente y gradual las vistas materializadas para continuar suministrando beneficios de rendimiento de baja latencia. Más información.
Vistas materializadas automatizadas: las organizaciones están creando más que nunca aplicaciones dependientes de datos, paneles, informes y consultas ad hoc. Cada aplicación debe ajustarse y optimizarse, lo que requiere tiempo, recursos y dinero. Las vistas materializadas son una herramienta importante para mejorar el rendimiento de las consultas. Dichas vistas pueden establecerse si se cuenta con cargas de trabajo bien definidas. Sin embargo, es posible que sus cargas de trabajo hayan aumentado y los patrones de las consultas no sean predecibles. Las vistas materializadas automatizadas mejoran el rendimiento de las consultas, reducen la latencia de las consultas y disminuyen el tiempo de ejecución mediante la actualización automática, la reescritura automática de las consultas, la actualización progresiva y la supervisión continua de los clústeres de Amazon Redshift. Amazon Redshift equilibra la creación y administración de las AutoMV con un uso mínimo de recursos. Más información.
Machine learning para maximizar el procesamiento y el rendimiento: las capacidades avanzadas de machine learning de Amazon Redshift ofrecen un alto nivel de procesamiento y rendimiento, incluso con cargas de trabajo diversas o actividad de usuarios simultánea. Amazon Redshift utiliza algoritmos sofisticados para predecir y clasificar las consultas entrantes en función de sus tiempos de ejecución y los requisitos de los recursos para administrar de forma dinámica el rendimiento y la simultaneidad, mientras también lo ayuda a priorizar las cargas de trabajo clave para la empresa. La aceleración de consultas cortas (SQA) envía consultas breves a partir de aplicaciones como paneles a una cola rápida para que se procesen inmediatamente, en vez de quedar estancadas detrás de consultas largas. La administración automática de cargas de trabajo (WLM) emplea el machine learning para administrar la memoria y la simultaneidad de forma dinámica, lo que ayuda a maximizar el procesamiento de consultas. Además, ahora puede definir de manera sencilla la prioridad de las consultas más importantes, inclusive cuando se envían cientos de ellas. Amazon Redshift también es un sistema de autoaprendizaje que observa las cargas de trabajo de los usuarios, determina las oportunidades para mejorar el rendimiento a medida que crece el uso, aplica optimizaciones sin inconvenientes y efectúa recomendaciones mediante Redshift Advisor cuando se necesita una acción de usuario explícita para agilizar aún más el rendimiento de Redshift.
Almacenamiento de resultados en caché: Amazon Redshift utiliza el almacenamiento en caché de resultados a fin de ofrecer tiempos de respuesta menores a un segundo para las consultas repetidas. Las herramientas de panel, visualización e inteligencia empresarial que ejecutan consultas repetidas experimentan un importante aumento del rendimiento. Cuando se ejecuta una consulta, Amazon Redshift busca en la caché para saber si hay un resultado almacenado de una consulta anterior. Si encuentra un resultado almacenado en caché y los datos no han cambiado, devuelve inmediatamente dicho resultado en lugar de volver a ejecutar la consulta.
Almacenamiento de datos a escala de petabytes: con unos pocos clics en la consola o una simple llamada a la API, puede cambiar de manera sencilla la cantidad o el tipo de nodos en el almacenamiento de datos y ajustar la escala verticalmente a medida que cambien las necesidades. Con el almacenamiento administrado, se agrega capacidad de forma automática para admitir cargas de trabajo de hasta 8 PB de datos comprimidos. También puede ejecutar consultas en petabytes de datos ubicados en Amazon S3 sin tener que cargar ni transformar ningún dato con la característica Amazon Redshift Spectrum. Puede utilizar S3 como un lago de datos altamente disponible, seguro y rentable para almacenar datos ilimitados en formatos de datos abiertos. Redshift Spectrum ejecuta consultas en miles de nodos en paralelo para ofrecer resultados rápidos, independientemente de la complejidad de la consulta o del volumen de datos.
Opciones de precios flexibles: Amazon Redshift es el almacenamiento de datos más rentable y usted puede optimizar la forma de pago. Puede iniciar a pequeña escala por tan solo 0,25 USD por hora sin compromisos e incrementar la escala de manera horizontal por solo 1000 USD por terabyte por año. Amazon Redshift es el único almacenamiento de datos en la nube que ofrece precios con modalidad bajo demanda sin costos iniciales, con precios de instancias reservadas que pueden ahorrarle hasta un 75 % con un contrato de 1 a 3 años y precios por consulta basados en el volumen de datos escaneados en el lago de datos de Amazon S3. Los precios de Amazon Redshift incluyen transferencia de datos, almacenamiento para copias de seguridad, compresión de datos y seguridad integrada. A medida que aumente el volumen de los datos, puede utilizar el almacenamiento administrado en las instancias RA3 para almacenar datos de manera rentable a 0,024 USD por GB al mes.
Costo predecible, incluso con cargas de trabajo impredecibles: Amazon Redshift le permite escalar con un impacto mínimo en los costos, ya que cada clúster obtiene hasta una hora de créditos gratuitos de escalado de simultaneidad por día. Estos créditos gratuitos son suficientes para cubrir las necesidades de simultaneidad del 97 % de los clientes. Esto le da previsibilidad en su costo mensual, incluso durante los periodos de fluctuación de la demanda analítica.
Selección del tipo de nodo para obtener los mayores beneficios para las cargas de trabajo: puede elegir tres tipos de instancias para optimizar Amazon Redshift de acuerdo con sus necesidades de almacenamiento de datos: nodos RA3, de informática densa y de almacenamiento denso.
Los nodos RA3 le permiten escalar el almacenamiento del cómputo de manera independiente. Con RA3, obtiene un almacenamiento de datos de alto rendimiento que guarda datos en una capa de almacenamiento independiente. Tan solo debe ajustar el tamaño del almacenamiento de datos en función del rendimiento de consultas que necesite.
Los nodos de informática densa (DC) le permiten crear almacenamientos de datos de rendimiento muy elevado con CPU rápidas, gran capacidad de RAM y discos de estado sólido (SSD). Son la mejor opción para volúmenes de datos inferiores a los 500 GB.
Los nodos de almacenamiento denso (DS2) le permiten crear almacenamiento de datos grandes mediante el uso de unidades de disco duro (HDD) por un precio bajo cuando se compran instancias reservadas a 3 años. La mayoría de los clientes que utilizan clústeres de DS2 pueden migrar cargas de trabajo a clústeres de RA3 y obtener un rendimiento hasta 2 veces mayor y más almacenamiento por el mismo costo que DS2.
Para escalar un clúster o cambiar entre los distintos tipos de nodos, basta con realizar una única llamada a la API o hacer unos pocos clics en la consola de administración de AWS. Para obtener más información, consulte la página de precios.
Fácil, seguro y fiable
Aspectos generales
Enfóquese en pasar de los datos a la información en cuestión de segundos y en cumplir los resultados empresariales sin tener que preocuparse por administrar su almacenamiento de datos.
Amazon Redshift sin servidor: se trata de una opción sin servidor de Amazon Redshift que facilita la ejecución y el escalado de análisis en segundos sin necesidad de configurar ni administrar una infraestructura de almacenamiento de datos. Con Amazon Redshift sin servidor, cualquier usuario, incluidos los analistas de datos, los desarrolladores, los profesionales de negocios y los científicos de datos, puede obtener información de los datos con solo cargar y consultar los datos que se encuentran en el almacenamiento. Más información.
Query Editor v2: utilice SQL para que los datos y los lagos de datos de Amazon Redshift sean más accesibles para los analistas de datos, los ingenieros de datos y otros usuarios de SQL con una mesa de trabajo de analistas basada en la Web para la exploración y el análisis de datos. Query Editor v2 le permite visualizar los resultados de las consultas con un solo clic, crear esquemas y tablas, cargar datos de forma visual y explorar objetos de bases de datos. También proporciona un editor intuitivo para crear consultas, análisis, visualizaciones y anotaciones de SQL, y compartirlos de forma segura con su equipo.
Diseño de tabla automatizado: Amazon Redshift monitorea las cargas de trabajo de los usuarios y utiliza algoritmos sofisticados para buscar formas de mejorar el diseño físico de los datos con el fin de optimizar la velocidad de las consultas. La optimización automática de tablas selecciona las mejores claves de organización y distribución para optimizar el rendimiento de la carga de trabajo del clúster. Si Amazon Redshift determina que la aplicación de una clave mejorará el rendimiento del clúster, las tablas se modificarán automáticamente sin necesidad de que el administrador intervenga. Las características adicionales de Eliminación automática de limpieza, Clasificación automática de tablas y Análisis automático eliminan la necesidad de realizar un mantenimiento manual y de efectuar ajustes en los clústeres de Redshift para obtener el mejor rendimiento para los nuevos clústeres y las cargas de trabajo de producción.
Consultas por medio de sus propias herramientas: Amazon Redshift le brinda la flexibilidad de ejecutar consultas dentro de la consola o de conectarse a las herramientas de clientes de SQL, las bibliotecas o las herramientas de ciencia de datos, entre las que se incluyen Amazon QuickSight, Tableau, PowerBI, QueryBook y cuadernos de Jupyter.
API simple para interactuar con Amazon Redshift: Amazon Redshift le permite acceder fácilmente a los datos con todos los tipos de aplicaciones web tradicionales, nativas en la nube, en contenedores, sin servidor y basadas en servicios, y aplicaciones basadas en eventos. La API Data de Amazon Redshift simplifica el acceso a los datos, y su ingreso y egreso desde lenguajes de programación y plataformas compatibles con el AWS SDK, como Python, Go, Java, Node.js, PHP, Ruby y C++. La API Data elimina la necesidad de configurar controladores y de administrar conexiones de bases de datos. En cambio, puede ejecutar comandos SQL en un clúster de Amazon Redshift simplemente al llamar a un punto de enlace de API asegurado, proporcionado por la API Datos. La API Datos se encarga de administrar las conexiones de la base de datos y de almacenar los datos en búfer. La API Datos es asincrónica, por lo que puede recuperar sus resultados luego. Los resultados de la consulta se conservan por 24 horas.
Tolerancia a errores: existen numerosas características que mejoran la fiabilidad del clúster de almacenamiento de datos. Por ejemplo, Amazon Redshift supervisa de forma continua el estado del clúster, vuelve a replicar automáticamente los datos de las unidades defectuosas y reemplaza los nodos según sea necesario para admitir la tolerancia a errores. Los clústeres también se pueden reubicar en zonas de disponibilidad (AZ) alternativas, sin perder datos ni realizar cambios en la aplicación.
AWS cuenta con capacidades de seguridad integrales para cumplir los requisitos más demandantes y Amazon Redshift ofrece seguridad para datos sin costo adicional.
Controles pormenorizados de acceso: los controles pormenorizados de seguridad de nivel de columnas y filas garantizan que los usuarios solo vean los datos a los cuales deberían tener acceso. Amazon Redshift se integra a AWS Lake Formation, lo que garantiza que los controles de acceso de nivel de columnas de Lake Formation también se apliquen a las consultas de Redshift en los datos del lago de datos.
El uso compartido de datos de Amazon Redshift es compatible con el control de acceso centralizado con AWS Lake Formation para simplificar la gobernanza de datos compartidos desde Amazon Redshift. AWS Lake Formation (LF) es un servicio que facilita la configuración de lagos de datos seguros, para administrar de forma centralizada el acceso pormenorizado a los datos en todos los servicios de consumo, así como para aplicar controles a nivel de fila y de columna.
Enmascaramiento de datos dinámico: con el enmascaramiento de datos dinámico, los clientes pueden proteger con facilidad sus datos confidenciales al limitar hasta qué punto los datos de identificación son visibles para los usuarios. Además, brindan la capacidad de definir varios niveles de permisos para estos campos, de modo que diferentes usuarios y grupos pueden contar con diferentes niveles de acceso a los datos sin tener que crear varias copias de datos, todo a través de la interfaz de SQL familiar de Redshift.
Multi-AZ: la nueva configuración multi-AZ de Redshift amplía aún más las capacidades de recuperación ya que reduce el tiempo de recuperación y garantiza la capacidad de recuperación automática sin pérdida de datos. Un almacenamiento de datos multi-AZ de Redshift aumenta el rendimiento y el valor al brindar alta disponibilidad sin tener que utilizar recursos en espera.
Cifrado integral: con tan solo unos pocos ajustes en los parámetros, puede configurar Amazon Redshift para que utilice SSL con el fin de proteger los datos en tránsito y el cifrado AES-256 acelerado por hardware para los datos en reposo. Si decide habilitar el cifrado de los datos inactivos, todos los datos que se graben en el disco y las backups se cifrarán. De forma predeterminada, Amazon Redshift se ocupa de la administración de claves.
Aislamiento de la red: Amazon Redshift le permite configurar las reglas del firewall para controlar el acceso de red al clúster de almacenamiento de datos. Puede ejecutar Amazon Redshift en Amazon Virtual Private Cloud (VPC) para aislar el clúster de almacenamiento de datos en su propia red virtual y conectarlo a la infraestructura de TI existente mediante conexiones IPsec VPN cifradas estándar del sector.
Auditoría y conformidad: Amazon Redshift se integra con AWS CloudTrail para que pueda auditar todas las llamadas a la API de Redshift. Redshift registra todas las operaciones SQL, como los intentos de conexión, las consultas y los cambios realizados en el almacenamiento de datos. Puede obtener acceso a estos registros mediante la realización de consultas SQL en las tablas del sistema u optar por guardarlos en una ubicación segura de Amazon S3. Amazon Redshift cumple los requisitos de SOC 1, SOC 2, SOC 3 y PCI DSS de nivel 1. Para obtener más información, consulte la conformidad de la nube de AWS.
Tokenización: las user-defined functions (UDF, funciones definidas por el usuario) de Amazon Lambda permiten utilizar una función de AWS Lambda como una UDF en Amazon Redshift e invocarla desde las consultas de SQL de Redshift. Con esta funcionalidad, puede escribir extensiones personalizadas para su consulta SQL y lograr una mejor integración a otros servicios o productos de terceros. Puede escribir las UDF de Lambda para habilitar la tokenización externa, el enmascaramiento de datos, la identificación o desidentificación de datos mediante la integración a proveedores como Protegrity y proteger o desproteger la información confidencial en función de los permisos y los grupos del usuario en los momentos de las consultas.
Descubra más información acerca de las novedades.
Consulte la documentación de Amazon Redshift para leer información detallada del producto.