Blog de Amazon Web Services (AWS)

Tag: Amazon EMR

Alojamiento de sistemas IBM i y AIX con conectividad de baja latencia hacia AWS con Connectria

Por Jeff Fritz, Solutions Architect, Migrations – AWS; David Wilderman, VP Solutions Architecture – Connectria e Troy Mitchell, Director, Strategic Alliances – Connectria Los clientes con entornos de IBM i y AIX desean impulsar su modernización con Amazon Web Services (AWS). Los clientes pueden beneficiarse con una solución híbrida de baja latencia que permita nuevos casos de […]

Optimizar costos con Amazon EMR Instance Fleets y Managed Scaling

Por Patricio Vazquez, Arquiteto de Soluciones en AWS.   Introducción Amazon EMR es una plataforma de Big Data en la nube para ejecutar trabajos de procesamiento de datos distribuidos a gran escala, consultas SQL interactivas y aplicaciones de Machine Learning (ML) con Frameworks de análisis de código abierto como Apache Spark, Apache Hive y Presto. Para optimizar y aprovechar al máximo los recursos […]

Comparando Servicios de ETL para extracción, transformación y carga de datos en AWS

Por Cristian Camilo Castellanos, Arquitecto de Soluciones, WWPS LCC, Gabriel Gasca Torres, Arquitecto de Soluciones, WWPS LCC   El auge de la analítica como herramienta para extraer valor de los datos por parte de las organizaciones, ha generado una creciente demanda por servicios de extracción, transformación y carga (ETL) como parte fundamental de dentro de […]

Cómo Verizon Media Group migró de Apache Hadoop y Spark de su centro de datos a Amazon EMR

Este es un artículo de los autores invitados por Verizon Media Group   En Verizon Media Group (VMG), uno de los principales problemas a los que nos enfrentábamos era la dificultad de ampliar la capacidad de informática en el tiempo que se requiere para adquirir hardware, lo que a menudo llevaba meses. No era rentable […]

Integración de Amazon EMR con Amazon Redshift

En el pasado, los datos analíticos se analizaban en base a técnicas de Business Intelligence (BI) utilizando bases relacionales, porque básicamente los sistemas del proveedor o, como se los conoce en BI, los sistemas fuente (sistemas que la compañía usa para el control de inventario, finanzas, CRM, etc.) se almacenaron en bases relacionales y esta […]