Blog de Amazon Web Services (AWS)

Category: Amazon EMR

Cree copias de seguridad de los recursos de Lago de Datos de proveedores de telecomunicaciones

Por Lesly Reyes, Telco Solutions Architect y Maddyzeth Ariza, Data Architect Los lagos de datos otorgan la capacidad de cargar y consultar datos en su forma natural, hoy en día permiten a las organizaciones acelerar su estrategia de datos. El principal desafío para la administración del lago de datos es debido al almacenamiento de datos […]

Optimizar costos con Amazon EMR Instance Fleets y Managed Scaling

Por Patricio Vazquez, Arquiteto de Soluciones en AWS.   Introducción Amazon EMR es una plataforma de Big Data en la nube para ejecutar trabajos de procesamiento de datos distribuidos a gran escala, consultas SQL interactivas y aplicaciones de Machine Learning (ML) con Frameworks de análisis de código abierto como Apache Spark, Apache Hive y Presto. Para optimizar y aprovechar al máximo los recursos […]

Gestión de entornos informáticos para investigadores con Service Workbench en AWS

Por Henner Dierks y Anthony Antonuccio.   A través de la automatización de la nube, los investigadores deben ser capaces de soportar de forma rápida y segura entornos de investigación basados en la nube que les permitan dejar de preocuparse por la tecnología que están utilizando y en su lugar, centrarse en su investigación y […]

Cómo Verizon Media Group migró de Apache Hadoop y Spark de su centro de datos a Amazon EMR

Este es un artículo de los autores invitados por Verizon Media Group   En Verizon Media Group (VMG), uno de los principales problemas a los que nos enfrentábamos era la dificultad de ampliar la capacidad de informática en el tiempo que se requiere para adquirir hardware, lo que a menudo llevaba meses. No era rentable […]

Integración de Amazon EMR con Amazon Redshift

En el pasado, los datos analíticos se analizaban en base a técnicas de Business Intelligence (BI) utilizando bases relacionales, porque básicamente los sistemas del proveedor o, como se los conoce en BI, los sistemas fuente (sistemas que la compañía usa para el control de inventario, finanzas, CRM, etc.) se almacenaron en bases relacionales y esta […]