Ofertas

Categoria Amazon SageMaker Ground Truth Amazon SageMaker Ground Truth Plus
Fluxos de trabalho de rotulagem de dados Fluxos de trabalho personalizados ou mais de 30 fluxos de trabalho integrados para texto, imagens, vídeo e nuvens de pontos 3D. Você gerencia seus fluxos de trabalho de rotulagem de dados e a qualidade da rotulagem de dados Fluxos de trabalho personalizados ou mais de 30 fluxos de trabalho integrados para texto, imagens, vídeo e nuvens de pontos 3D. A AWS gerencia a qualidade e os fluxos de trabalho de rotulagem de dados
Usuário Cientistas de dados e engenheiros de ML Cientistas de dados, engenheiros de ML, gerentes de operações de dados e gerentes de programa
Quadro de funcionários Você escolhe: fornecedores terceirizados, o Amazon Mechanical Turk ou seu próprio quadro de funcionários privado Mão de obra especializada que pode ajudar a atender a seus requisitos de segurança, privacidade e conformidade de dados 
Técnicas de rotulagem de ML  Aprendizado ativo Aprendizado ativo, pré-rotulagem e validação de máquina 
Geração de dados sintéticos Compatível Compatível

IA generativa

Gere conjuntos de dados de alta qualidade para aprimorar os próprios modelos de base em tarefas específicas

O Amazon SageMaker Ground Truth Plus fornece interfaces de rotulagem, fluxos de trabalho de rotulagem e anotadores de dados qualificados que criam conjuntos de dados de alta qualidade necessários para personalizar os modelos de base. Os anotadores de dados podem realizar uma variedade de tarefas, como escrever pares de perguntas e respostas, gerar textos, resumir textos, reelaborar textos e fornecer legendas para imagens e vídeos com a finalidade de que o modelo aprenda com esses exemplos.

  • Perguntas e respostas: com os pares de perguntas e respostas, você pode preparar conjuntos de dados de demonstração que ensinam seu grande modelo de linguagem sobre como responder a perguntas.
Perguntas e respostas do Amazon SageMaker Ground Truth Plus
  • Legendas de imagens: com as legendas de imagens, é possível preparar conjuntos de dados que descrevem a cena e os objetos em uma imagem com riqueza de detalhes para treinar modelos de conversão de texto em imagem com a finalidade de que criem imagens precisas e criativas alinhadas com a sua intenção. Também é possível usá-las para treinar modelos de conversão de imagem em texto com a finalidade de fornecer uma descrição precisa da cena da imagem.
Legendas de imagens do Amazon SageMaker Ground Truth Plus
  • Legendas de vídeos: com as legendas de vídeos, é possível preparar conjuntos de dados que descrevem ações e a cena de um vídeo com riqueza de detalhes para treinar modelos de conversão de texto em vídeo com a finalidade de criar vídeos precisos e criativos alinhados com a intenção humana. Também é possível usá-las para treinar modelos de conversão de imagem em vídeo com a finalidade de fornecer uma descrição precisa do vídeo.
Legenda de vídeo: “legendas de vídeos do Amazon SageMaker Ground Truth Plus”

Alinhe grandes modelos de linguagens (LLMs) com as preferências humanas usando comentários humanos de alta qualidade

Os comentários humanos são essenciais para garantir que os LLMs gerem conteúdo alinhado com as preferências humanas, ou seja, o conteúdo é útil, preciso e inofensivo para os usuários realizarem as tarefas. O Amazon SageMaker Ground Truth Plus possibilita que os anotadores de dados analisem, ranqueiem e classifiquem as saídas do modelo e usem esses dados para treinar modelos para reduzir o conteúdo tóxico, repleto de erros ou irrelevante. Por exemplo, os anotadores podem ranquear diversas respostas que foram geradas por um chatbot e rotulá-las com base na precisão factual, relevância e clareza da escrita.

Detecção de objetos do Amazon SageMaker Ground Truth

Personalize os modelos de base existentes com dados específicos da empresa ou do setor

O Amazon SageMaker Ground Truth Plus permite que os clientes usem dados específicos da empresa (como documentação e mensagens) ou dados específicos do setor para personalizar um modelo de base existente para o caso de uso e os requisitos de qualidade.

Configure rapidamente as tarefas de anotação de dados para a IA generativa

Os clientes podem simplesmente fornecer uma breve descrição dos cronogramas e dos requisitos de rotulagem de dados para personalizar os modelos de base, e o Amazon SageMaker Ground Truth Plus vai configurar automaticamente os fluxos de trabalho, as interfaces de rotulagem e preparar uma força de trabalho altamente qualificada em nome do cliente. Comece a usar hoje.

Amazon SageMaker Ground Truth Plus

Quadro de funcionários especializado

Com o Amazon SageMaker Ground Truth Plus, a rotulagem é feita por um quadro de funcionários especializado, treinado em tarefas de machine learning (ML) que pode ajudar a atender aos seus requisitos de segurança, privacidade e conformidade de dados. Por exemplo, se você precisa de pessoas com experiência em rotular arquivos de áudio, poderá especificar esse requisito nas diretrizes fornecidas ao SageMaker Ground Truth Plus, e o serviço selecionará automaticamente rotuladores com essas habilidades.

Gerenciamento de rotulagem de dados de ponta a ponta

Com o Amazon SageMaker Ground Truth Plus, você pode criar facilmente conjuntos de dados de treinamento de alta qualidade sem criar aplicações de rotulagem ou gerenciar seus próprios quadros de funcionários de rotulagem. Você pode carregar dados junto com os requisitos de rotulagem no Amazon S3. Depois de carregar os dados, o SageMaker Ground Truth Plus se encarrega de configurar os fluxos de trabalho de rotulagem de dados e operá-los em seu nome.

Técnicas de rotulagem de ML

O Amazon SageMaker Ground Truth Plus usa técnicas de ML, incluindo aprendizado ativo, pré-rotulagem e validação de máquina, o que aumenta a qualidade do conjunto de dados de saída e diminui os custos de rotulagem de dados. Um fluxo de trabalho de rotulagem de várias etapas inclui modelos de ML para aprendizado ativo que permite ao Ground Truth Plus reduzir custos selecionando objetos (que podem ser uma imagem, uma gravação de áudio, uma seção de texto etc.) que precisam ser rotulados e modelos de ML para pré-rotular dados selecionados que reduzem o esforço humano. O Ground Truth Plus usa validação de máquina para identificar erros potenciais que são então enviados a uma etapa adicional de revisão humana. Isso melhora significativamente a qualidade do rótulo ao detectar erros humanos. Além disso, o Ground Truth Plus também usa recursos de rotulagem auxiliares, como “encaixe automático de cuboide 3D”, “previsão da próxima rotulagem de vídeo” e “segmento automático” por meio de uma interface de usuário intuitiva para reduzir o tempo necessário para tarefas de rotulagem de dados, melhorando, ao mesmo tempo, a qualidade.

Painéis interativos

O SageMaker Ground Truth Plus fornece painéis interativos e interfaces de usuário, para que você possa monitorar o progresso dos conjuntos de dados de treinamento em vários projetos, rastrear as métricas do projeto, como taxa de transferência diária, inspecionar a qualidade dos rótulos e fornecer feedback sobre os dados rotulados.

Amazon SageMaker Ground Truth

Nuvens de pontos 3D

Normalmente, as nuvens de pontos tridimensionais (3D) são capturadas usando dispositivos de Light Detection and Ranging (LIDAR – Detecção e determinação de distância por meio de luz) para gerar uma interpretação 3D de um espaço físico em um determinado momento. O SageMaker Ground Truth oferece fluxos de trabalho de rotulagem incorporados para dados de nuvem de pontos 3D, incluindo detecção de objetos, rastreamento de objetos e segmentação semântica.

Detecção de objetos

O fluxo de trabalho de detecção de objetos permite identificar e rotular objetos de interesse em uma nuvem de pontos 3D. Por exemplo, em um caso de uso de veículo autônomo, você pode rotular veículos, pistas e pedestres com precisão.

Detecção de objetos do Amazon SageMaker Ground Truth

Rastreamento de objetos

Com o fluxo de trabalho de rastreamento de objetos, você pode rastrear a trajetória de objetos de interesse. Por exemplo, um veículo autônomo precisa rastrear o movimento de outros veículos, linhas e pedestres. O Ground Truth permite rastrear a trajetória desses objetos em uma sequência de dados de nuvem de pontos 3D.

Rastreamento de objetos do Amazon SageMaker Ground Truth

Segmentação semântica

Com o fluxo de trabalho de segmentação semântica, você pode segmentar os pontos de uma nuvem de pontos 3D em categorias predefinidas. No exemplo de veículos autônomos, o Ground Truth poderia categorizar a presença de ruas, vegetação e estruturas.

Segmentação semântica do Amazon SageMaker Ground Truth

Vídeo

O SageMaker Ground Truth é compatível com casos de uso comuns de legendagem de vídeo com fluxos de trabalho integrados, incluindo detecção de objetos de vídeo, rastreamento de objetos de vídeo e classificação de clipes de vídeo.

Detecção de objetos de vídeo

Com o fluxo de trabalho de detecção de objetos de vídeo, é possível identificar objetos de interesse em uma sequência de quadros de vídeo. Por exemplo, na criação de um sistema de percepção para um veículo autônomo, você pode detectar outros veículos na cena ao redor do veículo.

Detecção de objetos de vídeo do Amazon SageMaker Ground Truth

Rastreamento de objetos de vídeo

Com o fluxo de trabalho de rastreamento de objetos de vídeo, é possível rastrear objetos de interesse em uma sequência de quadros de vídeo. Por exemplo, em um caso de uso de jogo esportivo, é possível rotular os jogadores com precisão durante todo o jogo.

Rastreamento de objetos de vídeo do Amazon SageMaker Ground Truth

Classificação de clipes de vídeo

Com o fluxo de trabalho de classificação de clipes de vídeo, é possível classificar um arquivo de vídeo em uma categoria pré-especificada. Por exemplo, você pode selecionar categorias pré-especificadas que melhor descrevem o vídeo, como uma partida esportiva ou congestionamento de tráfego em um cruzamento movimentado.

Classificação de clipes de vídeo do Amazon SageMaker Ground Truth

Imagens

O SageMaker Ground Truth oferece fluxos de trabalho de rotulagem incorporados para dados de imagens, incluindo classificação de imagens, detecção de objetos e segmentação semântica.

Classificação de imagens

A classificação de imagens é o processo de identificar uma imagem com base na sua representação no mundo real. Esse processo envolve a categorização de imagens em relação a um conjunto de rótulos predefinido. A classificação de imagens é útil para modelos de detecção de cena que precisam considerar todo o contexto da imagem. Por exemplo, podemos criar um modelo de classificação de imagens para que veículos autônomos detectem diversos objetos do mundo real, como outros veículos, pedestres, semáforos e sinalização.

Classificação de imagens do Amazon SageMaker Ground Truth

Detecção de objetos

Você pode usar o fluxo de trabalho de detecção de objetos para identificar e rotular objetos de interesse (por exemplo, pedestres, cães e gatos) em imagens. A tarefa de rotulagem envolve desenhar uma caixa delimitadora (uma caixa bidimensional, ou 2D) em volta dos objetos de interesse em uma imagem. Modelos de visão computadorizada treinados com imagens que têm caixas delimitadoras rotuladas aprendem que os pixels dentro da caixa correspondem ao objeto especificado.

Detecção de objetos do Amazon SageMaker Ground Truth

Segmentação semântica

Você pode usar fluxos de trabalho de segmentação semântica para rotular as partes exatas de uma imagem que correspondem ao que o modelo precisa aprender. Esses fluxos oferecem dados de treinamento de alta precisão porque os pixels individuais são rotulados. Por exemplo, a forma irregular de um carro em uma imagem pode ser capturada de forma exata com a segmentação semântica.

Segmentação semântica do Amazon SageMaker Ground Truth

Texto

O SageMaker Ground Truth oferece fluxos de trabalho de rotulagem incorporados para dados em texto, incluindo classificação de textos e reconhecimento de entidades nomeadas.

Classificação de textos

A classificação de textos envolve a categorização de strings de texto em relação a um conjunto de rótulos predefinido. Muitas vezes, a categorização de textos em rótulos diferentes é usada para modelos de Natural Language Processing (NLP – Processamento de linguagem natural) que identificam coisas como tópicos (por exemplo, descrições de produtos, avaliações de filmes) ou sentimentos.

Classificação de textos do Amazon SageMaker Ground Truth

Reconhecimento de entidades nomeadas

O Named Entity Recognition (NER – Reconhecimento de entidades nomeadas) envolve a pesquisa de dados em texto para localizar frases denominadas entidades. Cada entidade é categorizada com um rótulo, como “pessoa”, “organização” ou “marca”. Assim, na declaração “Assinei recentemente o Amazon Prime”, “Amazon Prime” seria a entidade nomeada e poderia ser categorizada como uma “marca”.

Reconhecimento de entidades nomeadas do Amazon SageMaker Ground Truth

Fluxos de trabalho personalizados

Você pode criar o seu próprio fluxo de trabalho de rotulagem no Ground Truth. Um fluxo de trabalho personalizado consiste em três componentes: (1) um modelo de IU que fornece aos rotuladores humanos todas as instruções e ferramentas necessárias para concluir a tarefa de rotulagem; (2) a lógica de pré-processamento encapsulada em uma função do AWS Lambda, se houver; e (3) a lógica de pós-processamento encapsulada em uma função do AWS Lambda, se houver. Há uma grande variedade de modelos de IU disponíveis. Você também pode carregar o seu próprio modelo JavaScript/HTML. A função de pré-processamento do Lambda pode fornecer os dados a serem rotulados e contexto adicional para o rotulador. A função de pós-processamento do Lambda pode ser usada para inserir um algoritmo de aprimoramento de precisão. O algoritmo pode avaliar a qualidade das anotações humanas ou pode encontrar um consenso sobre o que é “certo” quando os mesmos dados são fornecidos a vários rotuladores humanos. Os três componentes podem ser carregados usando o console do SageMaker Ground Truth.

Crie seu próprio fluxo de trabalho personalizado no Ground Truth

Forças de trabalho

O SageMaker Ground Truth oferece várias opções de força de trabalho humana para rotulagem de dados: (1) seus próprios funcionários; (2) provedores de serviços de rotulagem de dados terceirizados disponíveis no AWS Marketplace; e (3) força de trabalho obtida via crowdsourcing usando o Amazon Mechanical Turk.

Mechanical Turk
Mechanical Turk
Privada
Privada
Fornecedores
Fornecedores

Geração de dados sintéticos

Amazon SageMaker Ground Truth oferece suporte à geração de dados sintéticos. O SageMaker Ground Truth pode gerar centenas de milhares de imagens sintéticas rotuladas, ajudando a melhorar a precisão da rotulagem e eliminando a necessidade de rotular dados manualmente. Primeiro, você especifica seus requisitos de imagem ou fornece recursos 3D e imagens de referência, como imagens de desenho assistido por computador (CAD). Em seguida, artistas digitais da AWS criam imagens que imitam a pose e o posicionamento dos objetos e incluem variações de objetos ou de cenas. Além disso, os artistas digitais da AWS adicionam opcionalmente elementos específicos para criar imagens que não são incluídas com muita frequência em conjuntos de dados de treinamento.
Imagem de geração de dados sintéticos
Preço do Amazon SageMaker Ground Truth
Saiba mais sobre os preços da rotulagem de dados do Amazon SageMaker

Comece a usar a rotulagem de dados do Amazon SageMaker sem compromissos antecipados ou contratos de longo prazo.

Saiba mais 
Cadastre-se para obter uma conta da AWS
Cadastre-se para obter uma conta gratuita

Obtenha acesso instantâneo ao nível gratuito da AWS. 

Cadastrar-se 
Comece a criar no console
Comece a criar no console

Comece a criar com a rotulagem de dados do Amazon SageMaker no Console de Gerenciamento da AWS.

Faça login