Publié le: Sep 17, 2021

Amazon QuickSight a annoncé Dataset-as-a-Source, une nouvelle fonction qui fait gagner du temps aux clients et améliore la gouvernance des données. Dataset-as-a-Source permet aux utilisateurs de créer un nouveau jeu de données en utilisant un ou plusieurs jeux de données existants en entrée et de le combiner avec de toutes nouvelles sources de données, telles que d'autres bases de données, des fichiers CSV et des applications comme Twitter. Les curateurs peuvent créer des jeux de données centraux que les auteurs peuvent réutiliser pour créer les leurs. Les curateurs peuvent contrôler les définitions des métriques commerciales dans les jeux de données centraux, tandis que les auteurs gagnent du temps en obtenant un point de départ pour créer eux-mêmes de nouveaux jeux de données. Si la définition du jeu de données doit être mise à jour, les curateurs peuvent apporter des modifications aux jeux de données centraux et les jeux de données dépendants sont automatiquement mis à jour. Dataset-as-a-Source peut être utilisé pour combiner des jeux de données avec Direct Query, SPICE, ou une combinaison des deux. Cliquez ici pour en savoir plus.

Actuellement, les auteurs dépendent des curateurs pour créer des jeux de données complexes, et doivent attendre le temps que les curateurs passent à les concevoir. De plus, chaque jeu de données doit être créé à partir de zéro (à partir des sources de données originales). Par conséquent, les propriétaires de jeux de données doivent reproduire les métriques commerciales pertinentes dans chaque jeu de données. Lorsque la définition de la métrique change, il est inefficace de mettre à jour les jeux de données un par un, sans compter que vous courez le risque de manquer la mise à jour dans un jeu de données particulier ou de faire une erreur dans l'un d'entre eux.

Dataset-as-a-Source permet aux curateurs de créer des jeux de données centraux et de les partager avec les auteurs de leur équipe. Les auteurs peuvent utiliser ces jeux de données comme point de départ pour créer leurs propres jeux de données. Les curateurs peuvent définir des métriques commerciales dans les jeux de données centraux que les auteurs peuvent utiliser, sans avoir à refaire le travail de recréation des champs. En outre, les auteurs bénéficient de tout le travail de jointure et de filtrage effectué par les curateurs, sans avoir à le refaire. Si les curateurs souhaitent apporter des modifications à ces champs définis de manière centralisée, ils peuvent le faire dans un jeu de données central et les jeux de données associés reçoivent les mises à jour automatiquement, ce qui permet de gagner du temps et d'éviter les erreurs.

Dataset-as-a-Source est disponible dans les éditions Standard et Entreprise d'Amazon QuickSight dans toutes les régions QuickSight : USA Est (Virginie du Nord et Ohio), USA Ouest (Oregon), Canada, Sau Paulo, UE (Francfort, Irlande et Londres), Asie-Pacifique (Mumbai, Séoul, Singapour, Sydney et Tokyo) et USA Ouest (GovCloud). Pour plus de détails cliquez ici. Actuellement, les jeux de données utilisant la sécurité au niveau des lignes (RLS, Row Level Security) ou des colonnes (CLS, Column Level Security) ne peuvent pas être utilisés comme source pour un nouveau jeu de données. Cette possibilité sera toutefois ajoutée dans un avenir proche. RLS et CLS peuvent toujours être appliqués aux jeux de données dépendants créés à partir du jeu de données source.