Pular para o conteúdo principal

Amazon S3

Metadados do Amazon S3

Acelere a descoberta de dados com metadados de objetos praticamente em tempo real

Localize e organize os dados de que você precisa no Amazon S3

O Amazon S3 Metadata aproveita todo o potencial dos dados no Amazon S3 ao transformar os metadados dos objetos em itens facilmente acessíveis e mais simples de consultar. Disponibilize, armazene e consulte metadados avançados para todos os objetos armazenados no Amazon S3. Isso permite que você localize rapidamente os dados necessários para analytics de negócios, aplicações de inferência em tempo real e muito mais. O S3 Metadata fornece suporte a metadados de objetos, incluindo detalhes definidos pelo sistema, como tamanho e origem do objeto, além de metadados personalizados, que permitem o uso de etiquetas para fazer anotações nos objetos com informações como SKU do produto, ID da transação ou classificação de conteúdo. Os metadados do S3 preenchem automaticamente os metadados de objetos novos e existentes, fornecendo uma visão abrangente e consultável de seus dados. Leia o blog para saber mais.

Benefícios

Projetado para criar e gerenciar metadados para todos os objetos em seus buckets do S3, tanto objetos existentes quanto novos uploads, fornecendo uma visão abrangente de seus dados.

Encontre e recupere de maneira rápida os dados necessários em até trilhões de objetos no Amazon S3. Atualizamos os metadados de hora em hora para que você possa entender facilmente seu cenário de armazenamento mais recente.

Use as etiquetas de objetos para anotar seus objetos com metadados específicos de negócios a fim de aprimorar a organização e a capacidade de pesquisa dos dados.

Acesse seus metadados por meio de tabelas de inventário em tempo real e tabelas de diário em tabelas gerenciadas do S3, com suporte integrado ao Apache Iceberg.

Analise metadados usando serviços conhecidos da AWS, como Amazon Athena, Redshift e EMR, por meio da integração do S3 Tables com o Amazon SageMaker Lakehouse. O S3 Metadata é compatível com ferramentas conhecidas de código aberto.

Casos de uso

Use metadados avançados para catalogar todos os dados para facilitar a descoberta e a utilização. Tenha uma visão completa de todos os objetos em seus buckets do S3 para rastrear e entender seu armazenamento de dados.

Rastreie e gerencie os vídeos gerados por IA, incluindo a origem, o horário de criação e o modelo de IA usado, com o Amazon Bedrock.

Analise metadados de objetos em todo o seu espaço de armazenamento para identificar oportunidades de redução de custos e melhorias de desempenho.

Identifique e analise rapidamente conjuntos de dados relevantes para business intelligence e tomada de decisões.

Aperfeiçoe a organização dos dados e a conformidade por meio de anotações personalizadas de metadados.

Clientes

Telemática móvel de Cambridge

A Cambridge Mobile Telematics (CMT) é a maior provedora de serviços de telemetria do mundo. Sua missão é aumentar a segurança das rodovias e dos motoristas em todo o mundo. A plataforma orientada por inteligência artificial da empresa, DriveWell Fusion®, coleta dados de sensores de milhões de dispositivos de IoT, incluindo smartphones, etiquetas proprietárias, veículos conectados, câmeras de painel e dispositivos de entidades externas, e os combina com dados contextuais para criar uma visão unificada do comportamento do veículo e do motorista.

“Na CMT, armazenamos e analisamos vários petabytes de dados de dispositivos móveis de IoT em todo o mundo para melhorar a segurança do motorista e do trânsito. Conforme ampliamos nossas operações, localizar dados específicos para o desenvolvimento de novos insights e modelos se torna cada vez mais desafiador. O S3 Metadata, particularmente com a funcionalidade de metadados personalizados, possibilita a anotação de todos os nossos dados e a manutenção dos metadados em uma tabela gerenciada e consultável. Agora, a localização de dados relevantes requer apenas uma consulta SQL eficiente e econômica. Isso faz dos metadados do S3 um divisor de águas, permitindo que ofereçamos novos recursos aos nossos clientes. “

Tim Vogel, diretor de informações, Cambridge Mobile Telematics

Missing alt text value

PayPal

O PayPal está revolucionando o comércio global há mais de 25 anos. Ao criar experiências inovadoras que tornam a movimentação de dinheiro, as vendas e as compras mais simples, personalizadas e seguras, o PayPal capacita consumidores e empresas em cerca de 200 mercados a se conectarem e prosperarem na economia global.

“Os metadados do S3 nos fornecem um mecanismo simples e direto para analisar trilhões de objetos do S3 usando ferramentas padrão como o Amazon Athena e o Amazon QuickSight. Com essa funcionalidade, podemos gastar nosso tempo tomando decisões em vez de criar nossos complexos pipelines de dados para acessar e consultar metadados de objetos do S3. “

Jon Southall, vice-presidente de engenharia para o departamento de plataformas empresariais de grande escala, PayPal

Missing alt text value

Roche

A Roche é uma empresa do setor de biotecnologia que combina produtos farmacêuticos e diagnósticos para alcançar avanços na saúde personalizada e proporcionar melhorias na vida das pessoas.

“Os metadados do S3 aceleram nossas iniciativas generativas de IA. À medida que desenvolvemos aplicações de LLM, como chatbots internos para nossas equipes, dados não estruturados, como PDFs, tornam-se uma parte cada vez mais essencial. Precisamos ingerir uma grande quantidade de documentos específicos de domínio em uma aplicação de geração aumentada via recuperação (RAG) para que o chatbot possa se adaptar aos contextos específicos de negócios da Roche. Entretanto, isso também resulta em um aumento significativo na quantidade de dados não estruturados que devemos gerenciar. Precisamos de um sistema de metadados para descrever nossos dados não estruturados de forma eficiente, permitindo que os usuários filtrem rapidamente nosso extenso data lake e identifiquem os conjuntos de dados relevantes para a aplicação específica de IA generativa que estão desenvolvendo. Com o S3 Metadata, o desenvolvimento de um sistema robusto de metadados foi simplificado para apenas alguns cliques no Console de Gerenciamento da AWS. À medida que continuamos a ingerir mais dados não estruturados, o S3 Metadata identifica automaticamente os metadados e os mantém atualizados. Além disso, empregamos nossa própria função do Lambda para extrair metadados específicos do negócio, como a classificação de documentos segundo uma taxonomia relevante para a Roche, e armazenamos esses metadados no mesmo catálogo do Glue, juntamente com a tabela do S3 Metadata. Isso nos permite, por meio de uma simples junção SQL, acessar todos os metadados necessários. Os metadados do S3 nos ajudam a criar aplicativos de IA generativos com mais rapidez, o que nos permite focar na criação em vez de organizar nossos dados. “

Yannick Misteli, diretor do departamento de engenharia comercial no setor farmacêutico, Roche

The Roche logo in blue text inside a blue hexagon outline on a transparent background.

SmugMug//Flickr

A SmugMug e o Flickr disponibilizam plataformas on-line para que fotógrafos realizem upload e compartilhem fotos e vídeos. A empresa mantém bilhões de fotos e vídeos armazenados em sua aplicação.

“Imagine pilotar uma máquina do tempo usando seus dados do Amazon S3. Na SmugMug e no Flickr, temos mais de 22 anos de fotos dos nossos clientes, totalizando centenas de bilhões de objetos, armazenados no S3. O novo recurso S3 Metadata simplifica e torna mais acessível a exploração dos metadados dos nossos objetos no S3, permitindo consultas sobre informações como o tamanho dos objetos ao longo do tempo. Isso facilita a compreensão da evolução dos nossos dados, eliminando a necessidade de combinar consultas complexas e custosas de banco de dados com inventários de objetos. Entender como nossos fotógrafos usam nosso armazenamento ajuda a aumentar nosso compromisso de construir um mundo melhor por meio do poder da fotografia. “

Andrew Shieh, engenheiro principal, SmugMug

Missing alt text value

Acelerar a descoberta de dados com metadados de objetos

Os metadados do Amazon S3 geram automaticamente metadados avançados para seus objetos do S3 quase em tempo real. Veja como exploramos e consultamos objetos com base em metadados personalizados usando tags de objeto. Se você estiver gerenciando data lakes em grande escala ou otimizando a descoberta de dados, você obterá informações práticas sobre o gerenciamento de dados orientado por metadados.