Publicado: Jun 22, 2022

O AWS Lake Formation é um serviço que permite a configuração de um data lake seguro em alguns dias. Um data lake é um repositório centralizado, selecionado e seguro que armazena todos os seus dados, tanto em sua forma original quanto preparados para análise. Um data lake permite romper os silos de dados e combinar diferentes tipos de análises para obter insights e orientar as melhores decisões de negócios.

Criar um data lake com o Lake Formation permite definir a localização dos seus dados e quais políticas de acesso aos dados e de segurança dos dados serão aplicadas. O Lake Formation coleta e cataloga os dados de bancos de dados e de armazenamento de objetos, move os dados para o novo data lake do Amazon S3, limpa e classifica os dados usando algoritmos de machine learning e protege o acesso aos dados confidenciais. Os usuários podem acessar um catálogo centralizado de dados que descreve os conjuntos de dados disponíveis e o respectivo uso apropriado. Assim, os usuários usam esses conjuntos de dados com seus serviços analíticos e de machine learning preferidos, como Amazon EMR para Apache Spark, Amazon Redshift Spectrum, AWS Glue, Amazon QuickSight e Amazon Athena.