Amazon DataZone apresenta a visualização de linhagem de dados baseada em API e compatível com OpenLineage em versão prévia

Publicado: 27 de jun de 2024

O Amazon DataZone apresenta a linhagem de dados em versão prévia, ajudando os clientes a visualizar eventos de linhagem a partir de sistemas habilitados para OpenLineage ou por meio de API e rastrear a movimentação de dados da origem ao consumo. O Amazon DataZone é um serviço de gerenciamento de dados usado pelos clientes para catalogar, descobrir, analisar, compartilhar e governar dados em grande escala além dos limites organizacionais com controles de governança e acesso.

O atributo de linhagem de dados do Amazon DataZone captura e visualiza as transformações de ativos e colunas de dados, fornecendo uma visão da movimentação de dados da origem ao consumo. Usando a API compatível com OpenLineage do Amazon DataZone, administradores de domínio e produtores de dados podem capturar e armazenar eventos de linhagem além do que está disponível no Amazon DataZone, incluindo transformações no Amazon S3, AWS Glue e outros serviços. Os consumidores de dados no Amazon DataZone podem ganhar confiança na origem de um ativo a partir da visão abrangente de sua linhagem, enquanto os produtores de dados podem avaliar o impacto das mudanças em um ativo entendendo seu consumo. Além disso, as versões do Amazon DataZone são compatíveis com cada evento, permitindo que os usuários visualizem a linhagem a qualquer momento ou comparem as transformações no histórico de um ativo ou de um trabalho. Essa linhagem histórica fornece uma compreensão mais profunda de como os dados evoluíram, essencial para solucionar problemas, auditar e validar a integridade dos ativos de dados.

A linhagem de dados do Amazon DataZone está disponível para visualização em todas as regiões da AWS nas quais o Amazon DataZone está disponível.

Para saber mais, acesse o Amazon DataZone, leia o blog de notícias da AWS e comece a usar a documentação de linhagem de dados.