Publié le: Nov 21, 2022
Amazon S3 améliore jusqu'à 9x les performances des requêtes exécutées sur Trino en utilisant Amazon S3 Select. Trino est un moteur de requêtes SQL open source utilisé pour exécuter des analyses interactives sur des données stockées dans Amazon S3. Avec S3 Select, vous déléguez la tâche de calcul pour filtrer vos données S3 au lieu de renvoyer l'objet entier. En utilisant Trino avec S3 Select, vous ne récupérez qu'un sous-ensemble de données d'un objet, ce qui réduit la quantité de données retournées et accélère les performances des requêtes.
À partir d'aujourd'hui, la contribution en amont d'AWS au moteur open source Trino vous permet d'utiliser Trino avec S3 Select pour améliorer les performances de vos requêtes. S3 Select décharge les tâches de filtrage et d'accès aux données à l'intérieur des objets vers Amazon S3, ce qui réduit la quantité de données qui doivent être transférées et traitées par Trino. Par exemple, si vous avez un lac de données basé sur Amazon S3 et que vous utilisez Trino, vous pouvez désormais utiliser la capacité de filtrage de S3 Select pour exécuter rapidement et facilement des requêtes interactives ad hoc.
Pour en savoir plus sur l'utilisation de S3 Select avec Trino, consultez le blog technique de S3. Pour en savoir plus sur le connecteur Trino S3 Select, visitez le référentiel GitHub de Trino. Pour plus d'informations sur la tarification, consultez la page de la tarification d'Amazon S3.