Preguntas frecuentes de Amazon DataZone

Aspectos generales

Amazon DataZone es un servicio de administración de datos que permite a los clientes catalogar, descubrir, compartir y gestionar de forma más rápida y sencilla los datos almacenados en AWS, en las instalaciones y en fuentes de terceros. Con Amazon DataZone, los ingenieros, los científicos de datos, los gerentes de productos, los analistas y los usuarios empresariales pueden acceder rápidamente a los datos de toda la organización para descubrirlos, usarlos y colaborar para obtener información basada en datos. Los administradores y propietarios de datos que supervisan los recursos de datos de una organización pueden administrar y controlar fácilmente el acceso a los datos. Amazon DataZone proporciona flujos de trabajo integrados para que los consumidores de datos soliciten acceso a los datos y para que los propietarios de los datos aprueben el acceso. 

Amazon DataZone ofrece a las personas un portal de administración de datos unificado para catalogar, descubrir, analizar y controlar los datos de toda la organización, así como para acceder a ellos e informar sobre ellos. De este modo, pueden colaborar más fácilmente con los ingenieros de datos y los administradores de TI para obtener información a partir de sus datos con mayor rapidez. Amazon DataZone ayuda a los usuarios a utilizar los recursos de datos que se encuentran en el catálogo de datos empresariales de Amazon Redshift Query Editor y Amazon Athena a través de una aplicación basada en la web. Esto elimina la necesidad de iniciar sesión en la consola de administración de AWS para los usuarios que prefieren una experiencia fuera de la consola. Para configurar o integrar los procesos existentes mediante programación, Amazon DataZone ha publicado una serie de API con directrices sobre cómo utilizarlas.

Puede usar Amazon DataZone para administrar los recursos de datos de las tablas de AWS Glue y las tablas de Amazon Redshift administradas por AWS Lake Formation. Además, con los conectores de AWS Glue y su integración con Amazon AppFlow, se pueden catalogar los activos de diversas fuentes para aumentar la visibilidad en toda la organización. Con la disponibilidad general, puede configurar Amazon DataZone para catalogar activos personalizados, siempre que tenga la flexibilidad de definir cuál podría ser ese activo. 

Los proyectos de Amazon DataZone son agrupaciones de usuarios, activos de datos y herramientas de análisis basadas en casos de uso empresarial. Proporcionan un espacio de colaboración donde los usuarios del proyecto pueden colaborar e intercambiar datos y artefactos. Los proyectos están protegidos para que solo puedan acceder a los datos y las herramientas los usuarios que se agreguen explícitamente al proyecto.

Cuando se implementa, el proyecto crea funciones de AWS Identity and Access Management (IAM) en función de las capacidades seleccionadas por el proyecto (por ejemplo, un lago de datos) que proporcionan a los usuarios el acceso necesario para realizar su trabajo. Los proyectos también proporcionan aislamiento laboral dentro de la misma cuenta, así como un límite de seguridad (grupos de seguridad y roles de IAM). Para trabajar con datos en proyectos, puede crear entornos. Los entornos crean roles de IAM en función de las herramientas y capacidades (por ejemplo, el lago de datos) que proporcionan a los usuarios el acceso necesario para realizar su trabajo. 

Sí, el catálogo de datos empresariales de Amazon DataZone admite un glosario empresarial. Un glosario empresarial es como un diccionario para una organización que enumera los términos empresariales con sus definiciones para garantizar que se utilicen las mismas definiciones en toda la organización al descubrir y analizar datos. Además, el catálogo de datos empresariales proporciona formularios de metadatos para personalizar, exigir o definir metadatos adicionales a los activos para que los encargados de los datos aprendan y comprendan el activo antes de usarlo para su análisis. 

Amazon DataZone resume el proceso de compartir datos entre productores y consumidores de datos mediante el uso de componentes de Lake Formation. Amazon DataZone automatiza el cumplimiento del acceso a los datos a los activos subyacentes (gestionados por Amazon DataZone) de acuerdo con las políticas aplicadas por los editores de datos. El cumplimiento se realiza sin necesidad de un administrador ni de movimiento de datos. 

Sí, es compatible con las API, AWS CloudFormation, la Interfaz de la línea de comandos de AWS (AWS CLI) y AWS Cloud Development Kit (AWS CDK). Para obtener más información sobre la compatibilidad con las API, consulte la documentación.