P: ¿Cuáles son los componentes principales de Amazon DataZone?
Amazon DataZone incluye cuatro componentes principales:
- Catálogo de toda la organización: haga visibles los datos con contexto empresarial para que todo el mundo pueda encontrarlos y comprenderlos con rapidez. Catalogue los datos de toda la organización de modo que pueda buscar datos para su análisis y solicitar acceso a los mismos.
- Flujo de trabajo de publicación y suscripción con administración de acceso: utilice el flujo de trabajo automatizado para ayudar a proteger los datos entre los productores y los consumidores y garantizar que los usuarios adecuados accedan a los datos correctos para los fines adecuados. Optimice la auditoría de quién utiliza qué conjuntos de datos para cada caso de uso empresarial con el flujo de trabajo de publicación y suscripción.
- Proyectos de datos: Simplifique el acceso a los análisis de AWS mediante la creación de agrupaciones de usuarios, activos de datos y herramientas de análisis basadas en casos de uso empresarial. Los proyectos de Amazon DataZone proporcionan un espacio de colaboración en el que los miembros del proyecto pueden colaborar, intercambiar datos y compartir artefactos. Los proyectos solo permiten que los usuarios agregados explícitamente accedan a las herramientas de datos y análisis. Los proyectos individuales administran la propiedad de los activos de datos producidos dentro del proyecto, de acuerdo con las políticas aplicadas por los administradores de los datos, lo que permite descentralizar la propiedad de los datos mediante una gobernanza federada.
- Portal (fuera de la Consola de administración de AWS): el portal de Amazon DataZone es una experiencia de datos integrada para que los usuarios promuevan la exploración e impulsen la innovación con una página de inicio personalizada. El portal es una experiencia fuera de la consola que facilita una colaboración interfuncional mientras se trabaja con datos y herramientas de análisis en la modalidad de autoservicio. Verifica las credenciales existentes de su proveedor de identidades.
P: ¿Qué tipo de catálogo es el catálogo de Amazon DataZone?
Amazon DataZone presenta un catálogo de metadatos empresariales. Los metadatos empresariales proporcionan información creada o utilizada por los empresarios y dan contexto a los datos de la organización. Pueden incluir información como:
- Propiedad: las organizaciones modernas centradas en los datos emplean un proceso de administración de datos distribuido en el que los LOB se encargan de administrar sus propios datos. Un catálogo hace un seguimiento de esa propiedad para que las partes interesadas puedan buscar datos y solicitar acceso a los mismos como parte de sus tareas empresariales.
- Clasificación: el descubrimiento de datos es una tarea clave que los metadatos empresariales pueden respaldar. El descubrimiento de datos utiliza ontologías y taxonomías corporativas definidas centralmente para clasificar el origen de datos y permite encontrar objetos de datos relevantes.
- Relaciones: puede utilizar el catálogo de datos de Amazon DataZone para agregar información de relaciones como metadatos. Al igual que ocurre con un esquema de conjunto de datos técnico, el catálogo de metadatos empresariales muestra las relaciones entre los objetos del catálogo, como las que existen entre las bases de datos, los conjuntos de datos y sus columnas.
P: ¿Qué son los dominios de Amazon DataZone?
Con los dominios, puede organizar de forma más segura los recursos alineados con los dominios empresariales, como los LOB. Un dominio es un conjunto de objetos de Amazon DataZone, como activos de datos, proyectos, cuentas de AWS asociadas y orígenes de datos. Los dominios son un contenedor escalable para usted, su equipo y las entidades de Amazon DataZone relacionadas, incluidos los recursos de datos y las herramientas de análisis, como Amazon Athena y Amazon Redshift Query Editor. Puede publicar un activo de datos en el catálogo con un dominio concreto que rija los datos. A continuación, puede controlar el acceso en sus cuentas y recursos de AWS asociados que pueden obtener acceso a ese dominio. Los dominios proporcionan un mecanismo para inculcar disciplina organizativa a los equipos que producen y catalogan los datos del catálogo de datos empresariales. Puede publicar un activo de datos en el catálogo en un dominio particular que gobierna los datos y controla el acceso de los consumidores que pueden acceder al dominio. Un dominio puede tener varios proyectos empresariales basados en casos de uso en los que colaboran personas.
P: ¿Cómo admite e integra Amazon DataZone otros servicios de AWS?
Amazon DataZone admite tres tipos de integraciones con otros servicios de AWS:
- Orígenes de datos del productor: puede publicar activos de datos en el catálogo de Amazon DataZone a partir de los datos almacenados en las tablas y vistas del Catálogo de datos de AWS Glue y Amazon Redshift. También puede publicar manualmente rutas y objetos de Amazon S3 (por ejemplo, imágenes y directorios) en el catálogo de Amazon DataZone.
- Herramientas de consumo: puede utilizar Amazon Athena o la versión 2 del editor de consultas de Amazon Redshift para acceder a sus activos de datos y analizarlos.
- Control de acceso y concesiones: Amazon DataZone permite conceder acceso a las tablas de AWS Glue administradas por AWS Lake Formation y a las tablas y vistas de Amazon Redshift. Para todos los activos de datos, Amazon DataZone publica eventos estándar relacionados con sus acciones (por ejemplo, la aprobación de una solicitud de suscripción) en Amazon EventBridge. Si Amazon DataZone no admite la administración del acceso a un activo de datos específico, puede utilizar estos eventos estándar para conceder el acceso (por ejemplo, tablas de Glue administradas por IAM y rutas de Amazon S3). También puede realizar integraciones con otros servicios de AWS o soluciones de terceros para realizar integraciones personalizadas con estos eventos estándar.
P: ¿Qué es el portal de Amazon DataZone?
Amazon DataZone ofrece a los analistas de datos un portal de administración de datos unificado para descubrir, preparar y analizar los datos de toda la organización, así como para acceder a ellos e informar sobre ellos. El portal les permite colaborar fácilmente con los ingenieros de datos y los administradores de TI para obtener información a partir de sus datos. Amazon DataZone permite a los usuarios consumir los activos de datos que se encuentren en el catálogo de metadatos empresariales mediante los editores de consultas de Amazon Redshift y Athena. Los activos de datos se consumen en una aplicación basada en la web, lo que elimina la necesidad de iniciar sesión en la consola de AWS a los usuarios que prefieran una experiencia fuera de la consola.
P: ¿Qué regiones se admiten en la versión preliminar?
En la versión preliminar de Amazon DataZone, el dominio raíz se puede aprovisionar en las regiones de AWS del Este de EE. UU. (Norte de Virginia), Oeste de EE. UU. (Oregón) o Europa (Irlanda). AWS IAM Identity Center, el sucesor de AWS Single Sign-On, debe configurarse en la misma región de AWS que el dominio raíz. Puede publicar datos de cualquiera de estas regiones en el catálogo de Amazon DataZone. Los usuarios pueden suscribirse a los datos y consumirlos dentro de la misma región que los datos de los servicios de análisis de AWS, como Amazon Redshift y Athena.

Explore todas las opciones de precios.

Obtenga acceso instantáneo a la capa gratuita de AWS.

Comience a crear con Amazon DataZone en la Consola de administración de AWS.