Publicado: Sep 5, 2018
O Amazon S3 anuncia recursos aprimorados no S3 Select. O S3 Select é um recurso do Amazon S3 desenvolvido para extrair apenas os dados necessários de um objeto, o que pode melhorar drasticamente a performance e reduzir o custo de aplicativos que precisam acessar dados no S3.
Hoje, o Amazon S3 Select funciona com objetos armazenados nos formatos CSV e JSON. Atendendo às solicitações dos clientes, temos o prazer de anunciar o suporte do S3 Select ao formato Apache Parquet, ao JSON Arrays e à compressão BZIP2 para objetos CSV e JSON. Também estamos adicionando o suporte a métricas do CloudWatch para o S3 Select, que permitem monitorar o uso do S3 Select pelos aplicativos.
O Parquet é amplamente adotado porque oferece suporte a um grande número de mecanismos de pesquisa, como Hive, Presto e Impala, além de várias estruturas, incluindo Spark e MapReduce. O S3 Select Parquet permite usar o S3 Select para recuperar colunas específicas de dados armazenados no S3 e oferece suporte à compressão colunar usando GZIP ou Snappy. O formato do resultado pode ser especificado como CSV ou JSON. Além disso, você pode determinar a forma como os registros do resultado são delimitados.
O suporte a JSON Arrays permite iterar nós internos nos objetos JSON. Você pode pesquisar esses objetos JSON aninhados especificando a navegação do caminho na cláusula FROM das consultas do S3 Select.
O BZIP2 é um formato de compressão amplamente adotado, usado para compactar dados textuais com mais eficiência que muitos outros tipos de algoritmos de compressão.
As métricas do CloudWatch para o S3 permitem acompanhar a integridade dos aplicativos. Essas métricas estão disponíveis em intervalos de um minuto e permitem identificar e agir rapidamente na ocorrência de problemas operacionais. As novas métricas específicas do S3 Select incluem a contagem de solicitações do S3 Select, a quantidade de dados verificados e a quantidade de dados retornados.
Esses recursos do Amazon S3 Select estão disponíveis em todas as regiões comerciais da AWS a partir de hoje.
Para saber mais sobre o Amazon S3 Select, consulte a página Como selecionar conteúdo de objetos no guia do desenvolvedor do Amazon S3. Para saber mais sobre as métricas do Amazon CloudWatch para S3, consulte a página Métricas de monitoramento com o Amazon CloudWatch no guia do desenvolvedor do Amazon S3. Para começar a usar, acesse o Console de Gerenciamento da AWS.