Características dinámicas de Amazon Redshift

Obtención de un precio, una escalabilidad y una seguridad excepcionales

Abrir todo

Las instancias RA3 maximizan la velocidad para cargas de trabajo con rendimiento intensivo que necesitan grandes volúmenes de capacidad informática, con la flexibilidad de pagar los recursos informáticos por separado del almacenamiento especificando el número de instancias que necesita.

El almacenamiento en columnas, la compresión de datos y las asignaciones de zona reducen la cantidad de operaciones de E/S necesarias para realizar consultas. Además de las codificaciones estándar del sector, como LZO y Zstandard, Amazon Redshift también ofrece la codificación de compresión AZ64, elaborada específicamente para los tipos numéricos y de fecha y hora, con el fin de proporcionar ahorros en el almacenamiento y rendimiento de consultas optimizado.

Admite consultas y usuarios simultáneos prácticamente ilimitados con niveles de servicio estables mediante la incorporación de capacidad transitoria en segundos a medida que aumenta la simultaneidad. Amplíe con un impacto mínimo en los costos, ya que cada clúster gana hasta una hora de créditos gratuitos de escalado simultáneo por día. Estos créditos gratuitos son suficientes para cubrir las necesidades de simultaneidad del 97 % de los clientes.

Comience a escribir en bases de datos de Redshift desde otros almacenamientos de datos de Redshift en tan solo unos clics, lo que permitirá una colaboración de datos aún mayor y un escalado flexible del cómputo para cargas de trabajo de procesamiento de datos y ETL mediante la incorporación de almacenes de diferentes tipos y tamaños en función de las necesidades de relación entre precio y rendimiento. Disfrute de una mayor transparencia en el uso de la computación, ya que a cada almacén se le factura su propia computación y, por lo tanto, puede mantener sus costos bajo control.

Las vistas materializadas de Amazon Redshift permiten lograr un rendimiento de consultas notablemente más rápido para las cargas de trabajo de análisis iterativas o predecibles, como la preparación de paneles y las consultas desde herramientas de inteligencia empresarial (BI), y los trabajos de procesamiento para extraer, transformar y cargar (ETL) datos. Puede utilizar las vistas materializadas para almacenar y administrar los resultados precalculados de una instrucción SELECT que puede hacer referencia a una o más tablas, incluidas las tablas de lagos de datos, la modalidad sin ETL y las tablas externas. Con la actualización incremental, Amazon Redshift identifica los cambios en la tabla o tablas base que se produjeron después de la actualización anterior y actualiza únicamente los registros correspondientes en la vista materializada. La actualización incremental se ejecuta más rápido que una actualización completa y mejora el rendimiento de la carga de trabajo.

Proporcione tiempos de respuesta inferiores a un segundo para consultas repetidas. Las herramientas de panel, visualización y BI que ejecutan consultas repetidas experimentan un importante aumento del rendimiento. Cuando se ejecuta una consulta, Amazon Redshift busca en la caché para saber si hay un resultado almacenado de una consulta anterior. Si se encuentra un resultado almacenado en caché y los datos no han cambiado, se recupera inmediatamente el resultado almacenado en caché en lugar de volver a ejecutar la consulta.

Un nuevo y eficaz mecanismo de clasificación de tablas que mejora el rendimiento de las consultas repetitivas al ordenar automáticamente los datos en función de los filtros de consultas entrantes (por ejemplo, ventas en una región específica). Este método acelera significativamente el rendimiento de los escaneos de tablas en comparación con los métodos tradicionales.

Amplíe las capacidades de recuperación al reducir el tiempo de recuperación y garantizar la capacidad de recuperación automática sin pérdida de datos. Un almacén de datos multi-AZ de Amazon Redshift aumenta el rendimiento y el valor al brindar alta disponibilidad sin tener que utilizar recursos en espera, lo que aumenta su disponibilidad al 99,99 % del SLA.

Amazon Redshift le permite configurar las reglas del firewall para controlar el acceso de red al clúster de almacenamiento de datos. Puede ejecutar Amazon Redshift en Amazon Virtual Private Cloud (Amazon VPC) para aislar el clúster del almacén de datos en su propia red virtual y conectarlo a la infraestructura de TI existente empleando una conexión IPsec VPN cifrada estándar del sector.

Con tan solo ajustar un par de parámetros, puede configurar Amazon Redshift para que utilice TLS para proteger los datos en tránsito y el cifrado AES-256 con aceleración por hardware para los datos en reposo. Si decide habilitar el cifrado de los datos en reposo, todos los datos que se graben en el disco y las copias de seguridad se cifrarán. De forma predeterminada, Amazon Redshift se ocupa de la administración de claves.

La integración con IAM Identity Center permite a las organizaciones respaldar la propagación de identidades confiables entre Amazon Redshift, Amazon QuickSight y AWS Lake Formation. Puede usar la identidad de su organización para acceder a Amazon Redshift en una experiencia de inicio de sesión único mediante proveedores de identidades (IdP) de terceros, como Microsoft Entra ID, Okta, Ping o OneLogin, desde Amazon QuickSight, Amazon Redshift Query Editor, herramientas de BI y editores de SQL de terceros. Los administradores pueden utilizar usuarios y grupos de IdP de terceros para gestionar el acceso detallado a los datos en todos los servicios y auditar el acceso a nivel de usuario en AWS CloudTrail. Con la propagación de identidades de confianza, la identidad de un usuario se transfiere sin problemas entre QuickSight, Amazon Redshift y Lake Formation, lo que reduce el tiempo necesario para obtener información y permite una experiencia de análisis sin problemas.

Los controles pormenorizados de seguridad de nivel de columnas y filas garantizan que los usuarios solo vean los datos a los cuales deberían tener acceso. Amazon Redshift se integra a Lake Formation, lo que garantiza que los controles de acceso de nivel de columnas en Lake Formation también se apliquen a las consultas de Amazon Redshift en los datos del lago de datos. El uso compartido de datos de Amazon Redshift es compatible con el control de acceso centralizado con Lake Formation para simplificar la gobernanza de datos compartidos desde Amazon Redshift. Lake Formation es un servicio que facilita la configuración de lagos de datos seguros, para administrar de forma centralizada el acceso pormenorizado a los datos en todos los servicios de consumo, así como para aplicar controles a nivel de fila y de columna. Con el enmascaramiento de datos dinámico, proteja sus datos confidenciales limitando la cantidad de datos identificables visibles para los usuarios. Defina varios niveles de permisos en estos campos para que distintos usuarios y grupos puedan tener distintos niveles de acceso a los datos sin tener que crear varias copias de los datos, todo ello a través de la conocida interfaz SQL de Amazon Redshift.

Descubra información valiosa con SQL sobre datos unificados en el lago de datos

Abrir todo

Analice todos sus datos unificados mediante SQL con la integración de Amazon Redshift con el almacén de lago de Amazon SageMaker. Consulte los datos de Amazon Simple Storage Service (Amazon S3) en formatos abiertos, lo que elimina el movimiento de datos entre lagos y almacenes. Abra sus datos de Amazon Redshift en el almacén de lago de SageMaker para permitir el acceso a las herramientas de análisis de AWS y Apache Iceberg, lo que permite el análisis integral de datos y machine learning (ML).

Amazon Redshift admite consultas de solo lectura con ANSI SQL conocido en formatos de tabla Apache Iceberg, Apache Hudi y Delta Lake, y consulta formatos de archivos abiertos, incluidos Apache Parquet, ORC, Avro, JSON y CSV, directamente en Amazon S3. Apache Iceberg es un ejemplo de formato de tabla de código abierto que proporciona coherencia transaccional y una mejor organización de los lagos de datos a través de su estructura de tablas. Amazon Redshift Spectrum le permite leer tablas y datos en formatos de datos abiertos, como Parquet, en su lago de datos y, al mismo tiempo, conservar hasta exabytes de datos estructurados, semiestructurados y no estructurados en Amazon S3. También puede exportar datos a su lago de datos mediante el comando UNLOAD de Amazon Redshift, que incluye la opción de exportar a Parquet. Exportar datos desde Amazon Redshift de regreso a un lago de datos le permite analizar los datos en mayor medida con servicios de AWS como Amazon Athena, Amazon EMR y SageMaker.

Utilice SQL para que los datos y los lagos de datos de Amazon Redshift sean más accesibles para los analistas de datos, los ingenieros de datos y otros usuarios de SQL con una mesa de trabajo de analistas basada en la Web para la exploración y el análisis de datos. Editor de consultas le permite visualizar los resultados de las consultas con un solo paso, crear esquemas y tablas, cargar datos de forma visual y explorar objetos de bases de datos. También proporciona un editor intuitivo para crear consultas, análisis, visualizaciones y anotaciones de SQL, y compartirlos de forma segura con su equipo.

Utilice el editor SQL integrado con tecnología de Amazon Redshift en SageMaker Unified Studio, un entorno de desarrollo de datos e IA, para consultar los datos almacenados en lagos de datos, almacenes de datos, bases de datos y aplicaciones.

Aceleración de la toma de decisiones con análisis casi en tiempo real

Abrir todo

La integración sin código entre Aurora, Amazon Relational Database Service (Amazon RDS), Amazon DynamoDB, las aplicaciones empresariales y Amazon Redshift permite realizar análisis y ML inmediatos en petabytes de datos de bases de datos y aplicaciones. Por ejemplo, en el caso de los datos escritos en fuentes de aplicaciones operativas, transaccionales o empresariales, las integraciones sin ETL de Aurora con Amazon Redshift hacen que los datos estén disponibles sin problemas en Amazon Redshift, lo que minimiza la necesidad de crear y mantener canalizaciones de datos ETL complejas.

Simplifique y automatice la ingesta de datos desde Amazon S3 y reduzca el tiempo y el esfuerzo para crear soluciones personalizadas o administrar servicios de terceros. Con esta característica, Amazon Redshift elimina la necesidad de ejecutar de manera manual y repetida procedimientos de copia al automatizar la ingesta de archivos y encargarse de los pasos de carga de datos continua entre bastidores. La compatibilidad con la copia automática permite a usuarios de negocio y analistas de datos, incluso sin experiencia en ingeniería de datos, crear reglas de ingesta y configurar fácilmente las ubicaciones de los datos que desean cargar desde Amazon S3.

Utilice SQL para conectarse a datos de Amazon Kinesis Data Streams y Amazon Managed Streaming para Apache Kafka (Amazon MSK) e ingerir directamente esos datos. La ingesta de streaming de Amazon Redshift facilita las canalizaciones de datos al permitirle crear vistas materializadas sobre los flujos directamente. Las vistas materializadas también pueden incluir transformaciones SQL como parte de la canalización ELT. Puede actualizar de manera manual vistas materializadas definidas para consultar los datos de streaming más recientes.

Realice consultas de datos en tiempo real desde una o varias instancias de Amazon RDS, entre las que se incluyen Amazon Aurora compatible con PostgreSQL, Amazon Relational Database (Amazon RDS) para MySQL y Amazon Aurora compatible con MySQL. Obtenga visibilidad instantánea de todas las operaciones empresariales sin necesidad de mover los datos.

Obtención de análisis de SQL sencillos sin administrar la infraestructura

Abrir todo

Ejecute análisis en segundos y escale sin necesidad de configurar y gestionar la infraestructura de almacenamiento de datos. La tecnología de escalado y optimización basada en inteligencia artificial permite a Amazon Redshift sin servidor aprovisionar y escalar de forma automática y proactiva la capacidad del almacén de datos, lo que ofrece un rendimiento rápido incluso para las cargas de trabajo más exigentes. El sistema utiliza técnicas de inteligencia artificial para aprender los patrones de carga de trabajo de los clientes en dimensiones clave, como las consultas simultáneas, la complejidad de las consultas, la afluencia de volumen de datos y los patrones de ETL. A continuación, ajusta continuamente los recursos a lo largo del día y aplica optimizaciones de rendimiento personalizadas. Puede establecer un objetivo de rendimiento deseado y el almacenamiento de datos se escalará automáticamente para mantener un rendimiento consistente.

Algoritmos sofisticados que predicen y clasifican las consultas entrantes en función de sus tiempos de ejecución y los requisitos de los recursos para administrar de forma dinámica el rendimiento y la simultaneidad, mientras también lo ayudan a priorizar las cargas de trabajo clave para la empresa. La aceleración de consultas cortas (SQA) envía consultas breves a partir de aplicaciones como paneles a una cola rápida para que se procesen inmediatamente, en vez de quedar estancadas detrás de consultas largas. La administración automática de cargas de trabajo (WLM) emplea el ML para administrar la memoria y la simultaneidad de forma dinámica, lo que ayuda a maximizar el rendimiento de consultas. Además, ahora puede definir la prioridad de las consultas más importantes, inclusive cuando se envían cientos de ellas. Amazon Redshift Advisor hace recomendaciones cuando se necesita una acción explícita del usuario para impulsar aún más el rendimiento de Amazon Redshift. Para cargas de trabajo dinámicas donde los patrones de consulta no son predecibles, las vistas materializadas automatizadas mejoran el rendimiento de las consultas, reducen la latencia de estas y disminuyen el tiempo de ejecución mediante la actualización automática, la reescritura automática de las consultas, la actualización progresiva y la supervisión continua de los clústeres de Amazon Redshift. La optimización automática de tablas selecciona las claves de organización y distribución para optimizar el rendimiento de la carga de trabajo del clúster. Si Amazon Redshift determina que la aplicación de una clave mejorará el rendimiento del clúster, las tablas se modificarán automáticamente sin necesidad de que el administrador intervenga. Las características adicionales de eliminación automática de limpieza, clasificación automática de tablas y análisis automático eliminan la necesidad de realizar un mantenimiento manual y de efectuar ajustes en los clústeres de Amazon Redshift para obtener el mejor rendimiento para los nuevos clústeres y las cargas de trabajo de producción.

Utilice una API simple para interactuar con Amazon Redshift: Amazon Redshift permite acceder fácilmente a los datos con todos los tipos de aplicaciones web tradicionales, nativas en la nube, en contenedores, sin servidor, basadas en servicios y basadas en eventos. La API de datos de Amazon Redshift simplifica el acceso a los datos, su ingesta y egreso desde lenguajes de programación y plataformas compatibles con el AWS SDK, como Python, Go, Java, Node.js, PHP, Ruby y C++. La API de datos elimina la necesidad de configurar controladores y de administrar conexiones de bases de datos. En cambio, puede ejecutar comandos SQL en un clúster de Amazon Redshift mediante una llamada a un punto de conexión de API asegurado, proporcionado por la API Datos. La API Datos se encarga de administrar las conexiones de la base de datos y de almacenar los datos en búfer. La API Datos es asincrónica, por lo que puede recuperar sus resultados luego. Los resultados de la consulta se conservan por 24 horas.

Ejecute consultas en la consola o conecte herramientas de cliente SQL, bibliotecas o herramientas de ciencia de datos, como QuickSight, Tableau, Microsoft Power BI, Alteryx, Querybook, cuaderno de Jupyter, Informatica, dbt, MicroStrategy y Looker.

Contextualización de las aplicaciones y aumento de la productividad de los usuarios con IA generativa

Abrir todo

Utilice un inglés sencillo para escribir consultas en Amazon Redshift Query Editor que generen de forma segura recomendaciones de código SQL precisas dentro del ámbito de sus permisos de acceso a los datos.

Amazon Redshift se integra perfectamente con Amazon Bedrock, lo que permite capacidades de IA generativa directas a través de comandos SQL estándar. Esta integración permite a los equipos de datos utilizar modelos de base como Anthropic Claude y Amazon Titan para tareas como el análisis de texto, la traducción y la detección de opiniones sin necesidad de recurrir a una infraestructura más compleja. Los usuarios pueden invocar sin problemas modelos de IA dentro de sus flujos de trabajo de análisis de datos existentes, lo que transforma la forma en que se extrae información de los datos empresariales.

El ML de Amazon Redshift facilita la creación, el entrenamiento y el despliegue de modelos de SageMaker mediante SQL a los analistas de datos, los científicos de datos, los profesionales de BI y los desarrolladores. Con el ML de Amazon Redshift, puede utilizar instrucciones SQL para crear y formar modelos de SageMaker a partir de los datos de Amazon Redshift y, luego, utilizar esos modelos para hacer predicciones, como la detección de la deserción de clientes, los pronósticos financieros, la personalización y la puntuación de riesgos directamente en sus consultas e informes. Incorpore modelos de lenguaje extensos en Amazon Redshift para realizar tareas avanzadas de procesamiento del lenguaje natural, como el resumen de textos, la extracción de entidades y el análisis de opiniones, para obtener información más profunda de sus datos mediante SQL.

Capacidades de Amazon Redshift

Obtención de un precio, una escalabilidad y una seguridad excepcionales

Descubra información valiosa con SQL sobre datos unificados en el lago de datos

Aceleración de la toma de decisiones con análisis casi en tiempo real

Obtención de análisis de SQL sencillos sin administrar la infraestructura

Contextualización de las aplicaciones y aumento de la productividad de los usuarios con IA generativa

Introducción a Amazon Redshift

Más información sobre los precios de Amazon Redshift

¿Listo para crear?

¿Tiene alguna otra pregunta?

Aprender

Recursos

Desarrolladores

Ayuda

Capacidades de Amazon Redshift

Obtención de un precio, una escalabilidad y una seguridad excepcionales

Instancias RA3

Almacenamiento eficiente y procesamiento de consultas de alto rendimiento

Escalado de simultaneidad

Escritura en múltiples almacenamientos de datos mediante uso compartido de datos

Vistas materializadas

Almacenamiento en caché de resultados

Diseños de datos multidimensionales (MDDL)

Multi-AZ

Aislamiento de red

Cifrado de extremo a extremo

Identidad unificada con integración de AWS IAM Identity Center

Controles de acceso pormenorizado

Descubra información valiosa con SQL sobre datos unificados en el lago de datos

Integración con el almacén de lago de Amazon SageMaker

Soporte de consultas de lago de datos para formatos de tablas y datos abiertos, incluido Apache Iceberg

Amazon Redshift Query Editor

Amazon SageMaker Unified Studio

Aceleración de la toma de decisiones con análisis casi en tiempo real

Integraciones sin ETL

Soporte de copia automática de Amazon S3

Ingesta de streaming de Amazon RedShift

Consulta federada

Obtención de análisis de SQL sencillos sin administrar la infraestructura

Tecnologías sin servidor

Autonomía

API de datos

Integración con herramientas de ETL y BI de terceros

Contextualización de las aplicaciones y aumento de la productividad de los usuarios con IA generativa

SQL generativo de Amazon Q en Query Editor

Integración con Amazon Bedrock

ML de Amazon Redshift

Introducción a Amazon Redshift

Más información sobre los precios de Amazon Redshift

¿Listo para crear?

¿Tiene alguna otra pregunta?

Aprender

Recursos

Desarrolladores

Ayuda