Histórias de sucesso / Agriculture

2023
amaggi logo

AMAGGI reúne mais de 8 milhões de imagens de satélite em Data Lake AWS

Com 45 anos de mercado, a AMAGGI é uma das maiores produtoras de grãos e fibras do Brasil. A companhia conta com quatro divisões de negócio - Agro, Commodities, Logística e Operações e Energia – e cerca de 9 mil colaboradores.

154 mil hectares

monitorados via sensoriamento remoto

8 milhões

de imagens de satélite armazenadas

Modelos de IA

ajudando a tomada de decisão no campo

Todos os pipelines

de ingestão dos dados realizados de forma automática

Dados gerados

pela divisão Agro integrados e centralizados no Data Lake

Overview

Com mais de 411 mil hectares plantados por ano, entre soja, milho e algodão e considerando a safra e a safrinha, a AMAGGI-Agro produz 711 mil toneladas de soja, 307 mil toneladas de algodão em pluma e 262 mil toneladas de milho e, para isso, conta hoje com 13 unidades produtoras.

Para auxiliar em seus processos agrícolas, a empresa conta com vários fornecedores de soluções tecnológicas especialistas em vários aspectos ao longo da safra, como soluções de análise de solos, monitoramento integrado de pragas, estações meteorológicas, telemetria de maquinários, imagens de satélite, etc. “Esses sistemas parceiros são responsáveis por gerar um volume massivo de dados, estruturados e não estruturados, todos os dias”, explica o responsável pela área de Agricultura Digital/Precisão da AMAGGI-Agro, Ricardo Moreira.

Os dados eram coletados em várias etapas do processo, desde o preparo do solo, passando pelo plantio e manejo até a colheita e comercialização. Moreira lembra que eles ficavam armazenados nos bancos de dados dos parceiros e seu uso era muitas vezes realizado através de relatórios, sem a flexibilidade necessária para automatizar algumas análises e realizar o cruzamento de informações de sistemas distintos.

Neste contexto, a AMAGGI entendeu que seria necessário investir em um ambiente próprio que possibilitasse o armazenamento e uso de todos os dados da empresa, independentemente de sua origem. Com isso, foi iniciado o projeto para a construção do Data Lake e o uso consistente desses dados, a fim de gerar ferramentas analíticas para auxiliar na tomada de decisão.

Oportunidade | Segurança e integração na mesma plataforma

Com a decisão, o projeto de criação do Data Lake foi entregue à Nuvem Tecnologia, parceiro especializado em inovação e pioneiro no uso de ciência de dados para o Agronegócio e membro do AWS Partner Network (APN), com duas demandas bem claras: construir toda a infraestrutura necessária para os dados da empresa; e desenvolver iniciativas de ciência de dados a fim de gerar conhecimento, visando a criação de soluções que possam auxiliar a empresa em seus processos existentes ou até mesmo trazer novos modelos de negócio que possam ser incorporados.

Para isso, o fornecedor definiu a AWS como o provedor da nuvem que abrigaria o novo Data Lake. A escolha foi baseada na gama de serviços e soluções oferecidos e na segurança e robustez do ambiente, capaz de suportar as iniciativas de dados. O projeto foi então iniciado com a realização de uma série de provas de conceito e coleta de dados para a sustentação de benchmarks.

A estratégia utilizada para o desenvolvimento do Data Lake foi, primeiro, pensar no insight necessário e, depois, definir a infraestrutura exigida para isso. Essa abordagem permitiu a criação de uma estrutura dinâmica e escalável, desenvolvida para que todas as áreas de negócio da AMAGGI possam utilizar o Data Lake em seus processos de tomada de decisão.

A infraestrutura começa pelo Amazon Simple Storage Service (Amazon S3), utilizado como repositório de dados. Os processos de ingestão e transformação dos dados são realizados por containers contendo diversas ferramentas de código aberto, como Apache NiFi, Apache Airflow e Apache Spark. Clusters do Amazon Elastic Kubernetes Service (Amazon EKS) e do Amazon Elastic Container Service (Amazon ECS) são usados para o gerenciamento deles. O Amazon Athena dá aos cientistas a possibilidade de acessar dados em todas as camadas do Data Lake e, a partir daí, modelá-las de acordo com a demanda. Para o uso de modelos de IA (Inteligência Artificial) e machine learning, o time da AMAGGI utiliza o Amazon SageMaker como ferramenta de análise exploratória de dados para o time de Data Science, enquanto o Amazon Redshift é usado como data warehouse.

kr_quotemark

O modelo é sustentável e nos permite manter soluções especialistas nos processos de governança operacional”

Ricardo Moreira
Gerente de produção da AMAGGI

 

Solução | Resultados e foco na produtividade

Atualmente, a AMAGGI possui no Data Lake cerca de 8 milhões de imagens de satélite armazenadas e monitora diariamente, de forma remota, cerca de 154 mil hectares de lavoura. As imagens de satélite são o principal insumo dos experimentos de ciência de dados que possibilitaram a criação e integração de modelos de ML/IA com ferramentas existentes, e hoje auxiliam a tomada de decisão no dia a dia do campo. A área de produção da AMAGGI já destaca ganhos trazidos pelo projeto. De acordo com Moreira, hoje a AMAGGI-Agro conta com toda a sua estrutura mapeada, podendo escolher ferramentas especialistas para cada processo agrícola.

“Quando quero correlacionar dados de ferramentas distintas, recorro ao Data Lake. Antes, eu tinha que fazer com que uma ferramenta conversasse com a outra”, comemora Moreira, citando os pontos de integração existentes dentro do Data Lake, com chaves específicas para correlacionar dados.

O coordenador de agricultura digital da empresa, Lucas Tavares, reforça que, como consequência e resultado do projeto, já é possível notar ganhos de produtividade e de qualidade advindos da agilidade na mineração e acurácia dos dados para a geração de mapas temáticos, suportando a tomada de decisões operacionais para a realização de Agricultura de Precisão em suas principais operações. Estes resultados, inclusive, estão servindo de estímulo para a realização de novos projetos no futuro.

Próximos passos

De acordo com Moreira, o uso de dados está preparando a AMAGGI para enfrentar novos desafios e se manter competitiva no mercado. “É um processo que envolve gente, inteligência e sensibilidade. Hoje conseguimos tomar decisões por meio de uma base muito forte. Não há informação sem dado fidedigno”, afirma.

Entre as provas de conceito em andamento, ele destaca o regulador de crescimento do algodão, que utiliza informações de satélite para gerar um mapa que permita ao agrônomo decidir sobre o uso de regulador de crescimento. Outro projeto pode resultar em uma comissão para o operador de máquinas, já que o Data Lake fornece dados de telemetria para que o time de RH crie indicadores para bonificar os melhores operadores com base em qualidade, eficiência e preservação de maquinário. “Como próximos passos, é esperado que os dados de todas as divisões de negócio sejam integrados no Data Lake, possibilitando o intercâmbio de informações entre elas a fim de otimizar as operações, garantindo a confiabilidade e a segurança dos dados armazenados”, prevê.

Sobre a Amaggi

Fundada em 1977, a AMAGGI é uma das maiores empresas brasileiras de grãos e fibras. Com sede em Cuiabá (MT), a companhia tem 74 unidades localizadas em 42 municípios de nove estados, além de unidades na Argentina, China, Holanda, Noruega, Paraguai, Suíça e Singapura.

Serviços AWS utilizados

Amazon S3

O Amazon Simple Storage Service (Amazon S3) é um serviço de armazenamento de objetos que oferece escalabilidade, disponibilidade de dados, segurança e performance líderes do setor.

Saiba mais»

Amazon SageMaker

O Amazon SageMaker baseia-se nas duas décadas de experiência da Amazon no desenvolvimento de aplicações de machine learning para o mundo real, incluindo recomendações de produtos, personalização, compras inteligentes, robótica e dispositivos assistidos por voz.

Saiba mais »

Amazon Elastic Kubernetes Service

O Amazon Elastic Kubernetes Service (Amazon EKS) é um serviço gerenciado do Kubernetes para executar o Kubernetes na nuvem da AWS e em datacenters on-premises.

Saiba mais »

Amazon Athena

O Amazon Athena é um serviço de análise interativo e sem servidor criado em frameworks de código aberto, com suporte a formatos de tabela e arquivo abertos.

Saiba mais »

Comece a usar

Organizações de todos os portes, em todos os setores, estão transformando seus negócios e cumprindo suas missões todos os dias usando a AWS. Entre em contato com nossos especialistas e comece sua própria jornada para a AWS hoje mesmo.