Rotulagem de dados do Amazon SageMaker

Crie conjuntos de dados de alta qualidade para treinar modelos de machine learning

O Amazon SageMaker oferece duas ofertas de rotulagem de dados, Amazon SageMaker Ground Truth Plus e Amazon SageMaker Ground Truth. Ambas as opções permitem identificar dados brutos, como imagens, arquivos de texto e vídeos, e adicionar rótulos informativos para criar conjuntos de dados de treinamento de alta qualidade para seus modelos de machine learning.

Amazon SageMaker Ground Truth Plus

Com o SageMaker Ground Truth Plus, você pode criar facilmente conjuntos de dados de treinamento de alta qualidade sem ter que criar aplicações de rotulagem ou gerenciar quadros de funcionários de rotulagem. O Amazon SageMaker Ground Truth Plus ajuda a reduzir os custos de rotulagem de dados em até 40%. O Amazon SageMaker Ground Truth Plus oferece um quadro de funcionários especializado e treinado em tarefas de ML e que pode ajudar a atender aos seus requisitos de segurança, privacidade e conformidade de dados. Basta carregar seus dados, e o Amazon SageMaker Ground Truth Plus cria fluxos de trabalho de rotulagem de dados e gerencia fluxos de trabalho em seu nome.

Amazon SageMaker Ground Truth

Se você deseja flexibilidade para criar e gerenciar seus fluxos de trabalho de rotulagem de dados e gerenciar seu próprio quadro de funcionários de rotulagem de dados, use o Amazon SageMaker Ground Truth. O SageMaker Ground Truth é um serviço de rotulagem de dados que facilita a rotulagem de dados e oferece a opção de usar anotadores humanos por meio do Amazon Mechanical Turk, de fornecedores terceirizados ou de seu próprio quadro de funcionários privado.

Como funciona

  • Rotular dados com o SageMaker Ground Truth Plus
  • Rotular dados com o SageMaker Ground Truth
  • Comparação de recursos
  • Rotular dados com o SageMaker Ground Truth Plus
  • O Amazon SageMaker Ground Truth Plus ajuda você a criar conjuntos de dados de treinamento de alta qualidade sem ter que criar aplicações de rotulagem ou gerenciar um quadro de funcionários de rotulagem.

    Como o Amazon SageMaker Ground Truth Plus funciona
  • Rotular dados com o SageMaker Ground Truth
  • O Amazon SageMaker Ground Truth ajuda você a criar e gerenciar seus próprios fluxos de trabalho de rotulagem de dados e quadro de funcionários de rotulagem de dados.

    Como o Amazon SageMaker Ground Truth funciona
  • Comparação de recursos
  • Categoria Amazon SageMaker Ground Truth Amazon SageMaker Ground Truth Plus
    Fluxos de trabalho de rotulagem de dados Fluxos de trabalho personalizados ou mais de 30 fluxos de trabalho integrados para texto, imagens, vídeo e nuvens de pontos 3D. Você gerencia seus fluxos de trabalho de rotulagem de dados e a qualidade da rotulagem de dados Os especialistas da AWS configuram fluxos de trabalho e os gerenciam em seu nome de acordo com seus requisitos de qualidade e de tempo de resposta.
    Usuário Cientistas de dados e engenheiros de ML Cientistas de dados, engenheiros de ML, gerentes de operações de dados e gerentes de programa
    Quadro de funcionários Você escolhe: fornecedores terceirizados, o Amazon Mechanical Turk ou seu próprio quadro de funcionários privado Quadro de funcionários especializado que pode ajudar a atender aos seus requisitos de segurança, privacidade e conformidade de dados 
    Técnicas de rotulagem de ML  Aprendizado ativo  Aprendizado ativo, pré-rotulagem e validação de máquina 

Benefícios

Melhore a qualidade dos conjuntos de dados de treinamento

As ofertas de rotulagem de dados do Amazon SageMaker fornecem técnicas de rotulagem de ML que são menos propensas a erros manuais e ajudam a melhorar a qualidade dos conjuntos de dados de treinamento. O Amazon SageMaker Ground Truth Plus tem um fluxo de trabalho de rotulagem de várias etapas que inclui modelos de ML para pré-rotulagem, validação de máquina de rotulagem humana para detectar erros e rótulos de baixa qualidade, além de recursos de rotulagem auxiliares (por exemplo, encaixe de cuboide 3D, previsão da próxima rotulagem de vídeo e ferramentas de segmentação automática). Se você estiver gerenciando seus próprios fluxos de trabalho de rotulagem de dados, o SageMaker Ground Truth oferece recursos de rotulagem automatizados, como segmentação automática, encaixe automático de cuboide 3D e fusão de sensores com quadros de vídeo 2D.  Além disso, o SageMaker Ground Truth fornece rotulagem de dados automática que usa aprendizado ativo e só encaminha dados rotulados para pessoas se o modelo não puder rotulá-los com segurança.

Escolha seu quadro de funcionários de rotulagem de dados

Com as ofertas de rotulagem de dados do Amazon SageMaker, você pode escolher seu quadro de funcionários de rotulagem de dados. Com o SageMaker Ground Truth Plus, um quadro de funcionários especializado e treinada em tarefas de ML rotula seus dados de acordo com seus requisitos de qualidade e tempo de resposta. Com o SageMaker Ground Truth, você tem opções para trabalhar com rotuladores dentro e fora da sua organização. Você pode enviar facilmente trabalhos de rotulagem a seus próprios rotuladores ou pode ter acesso a um quadro de funcionários de mais de 500.000 contratados independentes que já estão realizando tarefas relacionadas a ML por meio do Amazon Mechanical Turk. Se seus dados exigem confidencialidade ou habilidades especiais, você também pode usar fornecedores que são pré-selecionados pela AWS quanto a procedimentos de qualidade e segurança.

Aumente a visibilidade das operações de rotulagem de dados

As ofertas de rotulagem de dados do Amazon SageMaker permitem que você obtenha transparência nas operações de rotulagem de dados e gerenciamento de qualidade para que você possa verificar se seus requisitos de qualidade estão sendo atendidos. O SageMaker Ground Truth Plus fornece painéis interativos e interfaces de usuário, para que você possa monitorar o progresso dos conjuntos de dados de treinamento em vários projetos, rastrear as métricas do projeto, como taxa de transferência diária, inspecionar a qualidade dos rótulos e fornecer feedback sobre os dados rotulados.

Receba dados rotulados de alta qualidade com rapidez

Com as ofertas de rotulagem de dados do Amazon SageMaker, você pode receber dados rotulados de alta qualidade com rapidez. Com o SageMaker Ground Truth Plus, basta carregar seus dados no Amazon S3 junto com os requisitos de segurança, privacidade e conformidade. Os especialistas da AWS então configurarão o fluxo de trabalho de rotulagem de dados, e um quadro de funcionários especializado concluirá suas tarefas de rotulagem.

Comece a usar o Amazon SageMaker Ground Truth Plus