Publicado: Nov 21, 2022
O Amazon S3 melhora a performance das consultas executadas no Trino em até 9x ao usar o Amazon S3 Select. O Trino é um mecanismo de consulta SQL de código aberto usado para executar análises interativas em dados armazenados no Amazon S3. Com o S3 Select, você “reduz” o trabalho computacional para filtrar seus dados do S3 em vez de retornar o objeto inteiro. Ao usar o Trino com o S3 Select, você recupera apenas um subconjunto de dados de um objeto, reduzindo a quantidade de dados retornados e acelerando a performance da consulta.
A partir de hoje, com a contribuição upstream da AWS para o Trino de código aberto, você pode usar o Trino com o S3 Select para melhorar a performance de suas consultas. O S3 Select descarrega o trabalho pesado de filtrar e acessar dados dentro de objetos para o Amazon S3, o que reduz a quantidade de dados que precisam ser transferidos e processados pelo Trino. Por exemplo, se você tiver um data lake criado no Amazon S3 e usar o Trino hoje, poderá usar o recurso de filtragem do S3 Select para executar consultas ad hoc interativas de maneira rápida e fácil.
Para saber mais sobre como usar o S3 Select com o Trino, acesse o blog técnico do S3. Para saber mais sobre o conector do Trino ao S3 Select, visite repositório do GitHub do Trino. Para obter informações sobre os preços, consulte a página de preços do Amazon S3.