Questions fréquentes (FAQ) à propos d'Amazon DataZone

Questions d'ordre général

Amazon DataZone est un service de gestion des données qui permet aux clients de cataloguer, de découvrir, de partager et de gérer plus rapidement et plus facilement les données stockées sur AWS, sur site et auprès de sources tierces. Avec Amazon DataZone, les ingénieurs, les scientifiques des données, les chefs de produit, les analystes et les utilisateurs professionnels peuvent accéder rapidement aux données au sein de l'entreprise afin de les découvrir, de les utiliser et de collaborer pour obtenir des informations basées sur les données. Les administrateurs et les propriétaires de données qui supervisent les actifs de données d'une organisation peuvent facilement gérer et régir l'accès aux données. Amazon DataZone fournit des flux de travail intégrés permettant aux consommateurs de données de demander l'accès aux données et aux propriétaires de données d'approuver l'accès. 

Amazon DataZone fournit aux responsables des données un portail de gestion des données unifié leur permettant de cataloguer, de découvrir, d'accéder, d'analyser et de gérer les données au sein de l'entreprise. Ils peuvent ensuite collaborer plus facilement avec les ingénieurs de données et les administrateurs informatiques pour mieux comprendre leurs données. Amazon DataZone aide les utilisateurs à utiliser les actifs de données figurant dans le catalogue de données commerciales d'Amazon Redshift Query Editor et d'Amazon Athena via une application Web. Les utilisateurs qui préfèrent une expérience hors console n'ont donc plus besoin de se connecter à l'AWS Management Console. Pour configurer, configurer ou intégrer des processus existants de manière programmatique, Amazon DataZone publie des API avec des directives sur leur utilisation.

Vous pouvez utiliser Amazon DataZone pour gérer les actifs de données à partir des tables AWS Glue et des tables Amazon Redshift gérées par AWS Lake Formation. En outre, grâce aux connecteurs AWS Glue et à son intégration à Amazon AppFlow, les ressources provenant de différentes sources peuvent être cataloguées afin d'accroître la visibilité au sein de l'organisation. Grâce à la disponibilité générale, vous pouvez configurer Amazon DataZone pour cataloguer des actifs personnalisés, tout en ayant la flexibilité de définir ce que pourrait être cet actif. 

Les projets Amazon DataZone sont des regroupements d'utilisateurs, de ressources de données et d'outils d'analyse basés sur des cas d'utilisation professionnelle. Ils fournissent un espace collaboratif où les utilisateurs du projet peuvent collaborer et échanger des données et des artefacts. Les projets sont mieux sécurisés afin que seules les personnes explicitement ajoutées à un projet puissent accéder aux données et aux outils analytiques qu'il contient.

Une fois déployé, le projet crée des rôles AWS Identity and Access Management (IAM) basés sur les fonctionnalités sélectionnées par le projet (par exemple, un lac de données) qui fournissent aux utilisateurs l'accès requis pour effectuer leur travail. Les projets fournissent également une isolation du travail au sein d'un même compte, ainsi qu'une limite de sécurité (groupe de sécurité et rôles IAM). Pour travailler avec des données au sein de projets, vous pouvez créer des environnements. Les environnements créent des rôles IAM basés sur les outils et les fonctionnalités (par exemple, le lac de données) qui fournissent aux utilisateurs l'accès requis pour effectuer leur travail. 

Oui, le catalogue de données commerciales Amazon DataZone prend en charge un glossaire commercial. Un glossaire métier est similaire à un dictionnaire destiné à une organisation qui répertorie les termes commerciaux avec leurs définitions afin de garantir que les mêmes définitions sont utilisées dans l'ensemble de l'organisation lors de la découverte et de l'analyse des données. En outre, le catalogue de données commerciales fournit des formulaires de métadonnées permettant de personnaliser, de mandater ou de définir des métadonnées supplémentaires pour les actifs afin que les personnes chargées des données puissent apprendre et comprendre l'actif avant de l'utiliser pour leur analyse. 

Amazon DataZone résume le processus de partage de données entre les producteurs et les consommateurs de données en utilisant les constructions de Lake Formation. Amazon DataZone automatise l'accès aux données aux actifs sous-jacents (gérés par Amazon DataZone) conformément aux politiques appliquées par les éditeurs de données. L'exécution est prise en charge sans qu'il soit nécessaire de faire appel à un administrateur ou de déplacer des données. 

Oui, nous avons un support pour les API, AWS CloudFormation, l’interface de ligne de commande AWS (AWS CLS) et AWS Cloud Development Kit (AWS CDK). Pour plus de détails sur le support API, veuillez consulter la documentation.