Publié le: Oct 11, 2018
Amazon Athena est un service de requête interactif qui facilite l'analyse des données dans Amazon S3 à l'aide de la syntaxe SQL standard. Athena fonctionne sans serveur. Il n'existe aucune infrastructure à gérer et vous ne payez que pour les requêtes que vous exécutez. Nous offrons aujourd'hui la prise en charge de la création de tables à l'aide des résultats d'une requête Select ou la prise en charge de l'instruction Create Table As Select (CTAS). Les analystes peuvent utiliser les instructions CTAS pour créer de nouvelles tables à partir de tables existantes sur un sous-ensemble de données ou de colonnes, avec des options permettant de convertir les données en formats de colonne, telles que Apache Parquet et Apache ORC, et de les partitionner. Athena ajoute automatiquement la table et les partitions résultantes au catalogue de données Glue, les rendant immédiatement disponibles pour les requêtes suivantes. Par défaut, les instructions CTAS d’Athena écrivent des données en format Parquet. Les autres formats pris en charge incluent Apache ORC, AVRO, JSON et Text, avec des options permettant d’utiliser Gzip ou Snappy comme formats de compression. Vous pouvez aussi compartimenter vos données par colonnes ou choisir de les chiffrer.
Les instructions CTAS permettent de réduire les coûts et d'améliorer les performances en permettant aux utilisateurs d'exécuter des requêtes sur des tables plus petites construites à partir de tables plus grandes. Par exemple, vous pouvez utiliser une instruction CTAS pour créer une table qui sélectionne des colonnes spécifiques de deux tables différentes contenant des données au format JSON, convertit les résultats en format de colonne, tel que Parquet, et ajoute la table au catalogue de données Glue dans une seule déclaration, ce qui rend les requêtes ultérieures plus faciles, plus rapides et moins coûteuses. Avec les instructions CTAS, les analystes n'ont plus à compter sur les équipes d'ingénierie de données pour créer des tableaux alignés sur leurs charges de travail spécifiques, offrant ainsi un environnement en libre-service. Cliquez ici pour des exemples supplémentaires d’instructions CTAS. Les instructions CTAS sont facturées en fonction des octets analysés lors de la phase de sélection, de la même manière que les frais facturés par Athena pour les requêtes Select.