O blog da AWS

Tag: Amazon EMR

Monitorando o Amazon EMR no EKS com o Amazon Managed Prometheus e o Amazon Managed Grafana

Por Vara Bonthu e Gabriel Soto   O Apache Spark é uma estrutura de computação em cluster ultrarrápida de código aberto criada para processamento distribuído de dados. Com a combinação da nuvem, o Spark oferece alto desempenho para processamento de dados em lote e em tempo real em uma escala de petabytes. O Spark no […]

Comparando os serviços de ETL para extração, transformação e carga de dados na AWS

Por Cristian Camilo Castellanos, Arquiteto de Soluções, WWPS LCC, e Gabriel Gasca Torres, Arquiteto de Soluções, WWPS LCC.   A ascenção das técnicas de analytics como ferramenta para extrair valor dos dados pelas organizações gerou uma crescente demanda por serviços de extração, transformação e carga (ETL) como parte fundamental desses tipos de projetos. A integração, […]

Como o Verizon Media Group migrou do Apache Hadoop e do Spark on-premisses para o Amazon EMR

Esta é uma postagem de convidados do Verizon Media Group   No Verizon Media Group (VMG), um dos principais problemas que enfrentamos era a incapacidade de dimensionar a capacidade de computação em um período de tempo necessário — as aquisições de hardware demoravam meses para serem concluídas. A escalabilidade e o upgrade do hardware para […]

Integrando o Amazon EMR com o Amazon Redshift

Antigamente dados analíticos eram analisados com base nas técnicas de Business Intelligence (BI) utilizando bases relacionais, pois basicamente os sistemas provedores ou sistemas fontes como são conhecidos em BI (sistemas que a empresa usa para controle de estoque, financeiro, CRM, etc) são armazenados em bases relacionais e esta era a única forma de analise. As […]