Perguntas frequentes sobre o Amazon DataZone

Page Topics

Geral

Geral

O Amazon DataZone é um serviço de gerenciamento de dados que torna mais rápido e fácil para os clientes catalogar, descobrir, compartilhar e controlar dados armazenados na AWS, on-premises e em fontes terceirizadas. Com o Amazon DataZone, engenheiros, cientistas de dados, gerentes de produto, analistas e usuários corporativos podem acessar rapidamente os dados em toda a organização para que possam descobrir, usar e colaborar para obter insights baseados em dados. Administradores e proprietários de dados que supervisionam os ativos de dados de uma organização podem gerenciar e controlar facilmente o acesso aos dados. O Amazon DataZone fornece fluxos de trabalho integrados para que os consumidores de dados solicitem acesso aos dados e para que os proprietários dos dados aprovem o acesso. 

O Amazon DataZone oferece aos profissionais de dados um portal unificado de gerenciamento de dados para catalogar, descobrir, acessar, analisar e controlar dados em toda a organização. Eles podem então colaborar mais facilmente com engenheiros de dados e administradores de TI para obter insights de seus dados com mais rapidez. O Amazon DataZone ajuda os usuários a consumir ativos de dados que estão no catálogo de dados corporativos do Editor de Consultas do Amazon Redshift e do Amazon Athena por meio de uma aplicação baseada na web. Isso elimina a necessidade de fazer login no Console de Gerenciamento da AWS para usuários que preferem uma experiência fora do console. Para configurar, configurar ou integrar programaticamente com processos existentes, o Amazon DataZone tem APIs publicadas com diretrizes sobre como usá-las.

Você pode usar o Amazon DataZone para gerenciar ativos de dados das tabelas gerenciadas pelo AWS Lake Formation do AWS Glue e das tabelas do Amazon Redshift. Além disso, com os conectores do AWS Glue e sua integração com o Amazon AppFlow, ativos de várias fontes podem ser catalogados para aumentar a visibilidade em toda a organização. Com a disponibilidade geral, você pode configurar o Amazon DataZone para catalogar ativos personalizados, onde você tem a flexibilidade de definir o que esse ativo poderia ser. 

Os projetos do Amazon DataZone são agrupamentos de usuários, ativos de dados e ferramentas de análise baseados em casos de uso comercial. Eles fornecem um espaço colaborativo onde os usuários do projeto podem colaborar e trocar dados e artefatos. Os projetos são protegidos para que apenas os usuários explicitamente adicionados ao projeto possam acessar os dados e as ferramentas nele contidos.

Quando implantado, o projeto cria funções do AWS Identity and Access Management (IAM) com base nos recursos selecionados pelo projeto (por exemplo, um data lake) que fornecem aos usuários o acesso necessário para realizar seu trabalho. Os projetos também fornecem isolamento de trabalho dentro da mesma conta, bem como um limite de segurança (grupo de segurança e perfis do IAM). Para trabalhar com dados em projetos, você pode criar ambientes. Os ambientes criam perfis do IAM com base nas ferramentas e nos recursos (por exemplo, data lake) que fornecem aos usuários o acesso necessário para realizar seu trabalho. 

Sim, o catálogo de dados comerciais do Amazon DataZone oferece suporte a um glossário de negócios. Um glossário de negócios é como um dicionário para uma organização que lista termos comerciais com suas definições para garantir que as mesmas definições sejam usadas em toda a organização ao descobrir e analisar dados. Além disso, o catálogo de dados corporativos fornece formulários de metadados para personalizar, exigir ou definir metadados adicionais aos ativos para que os profissionais de dados aprendam e entendam o ativo antes de usá-lo em suas análises. 

O Amazon DataZone abstrai o processo de compartilhamento de dados entre produtores e consumidores de dados usando estruturas de Lake Formation. O Amazon DataZone automatiza o cumprimento do acesso aos dados aos ativos subjacentes (gerenciados pelo Amazon DataZone) de acordo com as políticas aplicadas pelos publicadores de dados. O atendimento é feito sem a necessidade de um administrador ou da movimentação de dados. 

Sim, adicionamos suporte para APIs, AWS CloudFormation, AWS Command Line Interface (AWS CLS) e AWS Cloud Development Kit (AWS CDK). Para obter mais detalhes sobre o suporte à API, consulte a documentação.