La nube de AWS
Introducción a Amazon Redshift

Para que las empresas se mantengan competitivas, los datos y el análisis se han vuelto fundamentales. Las empresas utilizan informes, paneles de control y herramientas analíticas para extraer información de los datos, monitorizar el desempeño de la empresa y respaldar la toma de decisiones. Estos informes, paneles y herramientas de análisis cuentan con almacenes de datos que almacenan los datos de manera eficaz para reducir la entrada y la salida y suministrar resultados de consultas a gran velocidad a cientos y miles de usuarios de manera simultánea.

Descargue el documento técnico: Enterprise Data Warehousing on AWS

El almacén de datos funciona como repositorio central de información proveniente de una o más fuentes de datos. Los datos se dirigen a un almacén de datos desde sistemas transaccionales y otras bases de datos relacionales y normalmente incluyen datos estructurados, semiestructurados y no estructurados. Estos datos se procesan, transforman y asimilan a una cadencia regular. Los usuarios, incluyendo científicos de datos, analistas empresariales y responsables de la toma de decisiones acceden a los datos procesados en el almacén de datos a través de herramientas de inteligencia empresarial, clientes SQL y hojas de cálculo.

 

  Almacén de datos Base de datos transaccional
Cargas de trabajo admitidas Análisis, big data Procesamiento de transacciones
Tipos de operaciones Optimizado para operaciones de escritura por lotes y lectura de grandes volúmenes de datos para minimizar la entrada y salida y maximizar el desempeño de datos Optimizado para operaciones de escritura continua y grandes volúmenes de operaciones de lectura pequeñas para maximizar el desempeño de transacciones
Normalización de datos Utilice esquemas no normalizados como Star y Snowflake Utilice esquemas altamente normalizados, que son más aptos para requisitos de alto desempeño de transacciones
Almacenamiento Requiere almacenamiento en columnas o especializado Bases de datos orientadas a filas que almacenan filas enteras en un bloque físico

AWS le permite aprovechar todas las ventajas principales asociadas con la informática bajo demanda, como el acceso a almacenamiento y capacidad informática que parecen ilimitados, y la capacidad de escalar el sistema en función del crecimiento de los datos recopilados, almacenados y consultados, pagando solo por los recursos que aprovisiona. Además, AWS ofrece un amplio conjunto de servicios administrados que se integran a la perfección entre sí, de manera que pueda implementar con rapidez una solución de análisis y almacenamiento de datos completa.

La siguiente ilustración muestra los pasos clave de una cadena de procesamiento de análisis completa y los servicios administrados disponibles en AWS para cada paso:

Canalización de análisis en AWS

Amazon Redshift es una solución de almacenamiento de datos rápida, sencilla de utilizar y totalmente administrada. Automatiza el aprovisionamiento de infraestructura y las tareas administrativas como los backups, la replicación y los parches. Se integra sin problemas con herramientas de ETL y BI de terceros, para que pueda obtener su primer informe en minutos. Además, no existen límites del volumen de datos que puede cargar y analizar. A medida que el volumen aumente, no tendrá que preocuparse por actualizaciones de sistema costosas o bajo desempeño. Redshift es rápido a cualquier escala, porque utiliza el almacenamiento en columnas y amplia optimización. Amazon Redshift también es rentable y usted solo paga por lo que usa. Puede tener un número ilimitado de usuarios realizando análisis ilimitados en todos sus datos por tan solo 1 000 USD por terabyte al año. Más información