Publicado: Nov 11, 2020
Agora, você pode usar o AWS Lake Formation na região AWS GovCloud (EUA-Oeste).
O AWS Lake Formation é um serviço que facilita a configuração de um data lake seguro em dias. Um data lake é um repositório centralizado, administrado e seguro que armazena todos os seus dados, tanto em sua forma original quanto preparados para análise. Um data lake permite romper os silos de dados e combinar diferentes tipos de análises para obter insights e orientar as melhores decisões de negócios.
Criar um data lake com o Lake Training é tão simples quanto definir a localização dos seus dados e quais políticas de acesso aos dados e de segurança dos dados serão aplicadas. O Lake Formation coleta e cataloga os dados de bancos de dados e de armazenamento de objetos, move os dados para o novo data lake do Amazon S3, limpa e classifica os dados usando algoritmos de Machine Learning e protege o acesso aos dados confidenciais. Os usuários podem acessar um catálogo centralizado de dados que descreve os conjuntos de dados disponíveis e o respectivo uso apropriado. Assim, os usuários utilizam esses conjuntos de dados com seus serviços analíticos e de machine learning preferidos, como o Amazon EMR for Apache Spark, Amazon Redshift Spectrum e Amazon Athena.