Geral

P: O que é o Amazon SageMaker Ground Truth?

R: O Amazon SageMaker Ground Truth facilita a rotulagem eficiente e precisa dos conjuntos de dados necessários para o treinamento de sistemas de Machine Learning. O SageMaker Ground Truth pode rotular automaticamente uma parte do conjunto de dados com base nos rótulos feitos manualmente por pessoas responsáveis pela rotulagem. É possível optar por usar uma força de trabalho colaborativa do Amazon Mechanical Turk com mais de 500.000 pessoas responsáveis pela rotulagem, seus próprios funcionários, ou com um dos fornecedores de terceiros pré-aprovados pela Amazon listados no AWS Marketplace. O SageMaker Ground Truth usa algoritmos inovadores e técnicas de UX (experiência do usuário) para melhorar a precisão da rotulagem humana. Com o tempo, o modelo se torna progressivamente melhor ao aprender continuamente com os rótulos criados por humanos, para aumentar a rotulagem automática.

P: O que é a rotulagem de dados automatizada?

R: A rotulagem de dados automatizada é a ação de rotular os dados usando Machine Learning. Primeiro, o Amazon SageMaker Ground Truth selecionará uma amostra aleatória de dados e a enviará para as pessoas rotularem. Os resultados serão usados ​​para treinar um modelo de rotulagem que tentará rotular uma nova amostra de dados brutos automaticamente. Os rótulos serão confirmados quando o modelo conseguir rotulá-los com uma pontuação de confiança que atenda ou exceda um limite alto. Quando a pontuação de confiança ficar abaixo desse limite, os dados serão enviados para as pessoas responsáveis pela rotulagem. Alguns dos dados rotulados por pessoas serão usados ​​para gerar um novo conjunto de dados de treinamento para o modelo de rotulagem, e o modelo será automaticamente treinado mais uma vez para melhorar a precisão. Esse processo se repete a cada amostra de dados brutos a ser rotulada. O modelo de rotulagem se tornará mais capaz de rotular automaticamente dados brutos em cada iteração, e menos dados serão encaminhados para pessoas.

Como usar o Amazon SageMaker Ground Truth

P: Por que devo usar o Amazon SageMaker Ground Truth?

R: Antes de criar, treinar e implantar modelos de Machine Learning, você precisará de dados. Os modelos bem-sucedidos são criados com base em dados de treinamento de alta qualidade, e coletar e rotular os conjuntos de dados de treinamento envolve muito tempo e esforço. Para criar os conjuntos de dados de treinamento, as pessoas responsáveis pela rotulagem precisam avaliar um grande número de imagens ou outros tipos de dados e, em seguida, identificar e rotular determinados objetos em cada tipo de dados. Essas tarefas de rotulagem são distribuídas entre muitas pessoas, gerando sobrecarga e custo significativos. Se houver rótulos incorretos, o sistema aprenderá com as informações incorretas e fará previsões imprecisas.

O Amazon SageMaker Ground Truth resolve esse problema facilitando a execução eficiente da rotulagem de dados altamente precisa, usando dados armazenados no Amazon S3, uma combinação de rotulagem de dados automatizada e rotulagem realizada por humanos.

P: Como posso começar a usar o Amazon SageMaker Ground Truth?

R: O Amazon SageMaker Ground Truth fornece uma experiência gerenciada na qual é possível configurar uma tarefa completa de rotulagem de dados em apenas algumas etapas. Para começar a usar o Amazon SageMaker Ground Truth, faça login no Console de Gerenciamento da AWS e navegue até o console do SageMaker. Neste ponto, selecione Tarefas de rotulagem no Ground Truth. Crie uma tarefa de rotulagem. Primeiro, como parte do fluxo de criação de tarefa de rotulagem, você fornece um ponteiro para o bucket do S3 que contém seu conjunto de dados a ser rotulado. O Ground Truth oferece modelos para tarefas comuns de rotulagem, bastando clicar em algumas opções e fornecer instruções mínimas sobre como rotular os dados. Como alternativa, crie seu próprio modelo personalizado. Como última etapa da criação de uma tarefa de rotulagem, você seleciona uma das três opções de força de trabalho humana: (1) uma força de trabalho colaborativa pública, (2) um conjunto selecionado de fornecedores que oferecem serviços de rotulagem de dados e (3) a reunião de seus próprios funcionários. Além disso, há a opção de ativar a rotulagem de dados automatizada.

P: Como meus conjuntos de dados de treinamento são gerenciados usando o Amazon SageMaker Ground Truth?

R: O Amazon SageMaker Ground Truth gerencia os metadados, os rótulos associados e uma taxonomia de seus rótulos e conjuntos de dados. É possível usar facilmente o AWS SDK por meio de um bloco de anotações do SageMaker ou do console do Ground Truth no console do SageMaker para consultar e gerenciar seus conjuntos de dados e rótulos. Acesse a documentação do Amazon SageMaker Ground Truth para obter mais informações.

P: Como o Amazon SageMaker Ground Truth ajuda a aumentar a precisão de meus conjuntos de dados de treinamento?

R: O Amazon SageMaker Ground Truth oferece os seguintes recursos para ajudar os clientes a aumentar a precisão da rotulagem de dados realizada por pessoas:

(a) Consolidação de anotações:isso neutraliza o erro/preferências de operadores individuais enviando cada objeto de dados a vários funcionários e, em seguida, consolidando as respostas deles (chamadas de "anotações") em um único rótulo. Em seguida, ele pega essas anotações e compara-as usando um algoritmo de consolidação de anotações. Esse algoritmo primeiro detecta anotações discrepantes que são desconsideradas. Em seguida, realiza uma consolidação ponderada das anotações, atribuindo pesos mais altos a anotações mais confiáveis. A saída é um rótulo único para cada objeto.

(b) Melhores práticas da interface de anotações: são os recursos das interfaces de anotações que permitem que os operadores realizem as tarefas com mais precisão. Operadores humanos são propensos a erros e preferências, e interfaces bem projetadas melhoram a precisão do operador. Uma melhor prática é exibir breves instruções juntamente com exemplos de rótulos bons e ruins em um painel lateral fixo. Outra melhor prática recomendada é escurecer a área fora do limite da caixa delimitadora quando os operadores estiverem desenhando a caixa delimitadora em uma imagem.

P: Como o Amazon SageMaker Ground Truth garante a proteção e a segurança dos meus dados?

R: Por padrão, o Amazon SageMaker Ground Truth criptografa seus dados em repouso e em trânsito. Além disso, o acesso a seus dados pode ser controlado usando o AWS Identity and Access Management (IAM). O Ground Truth não armazena nem faz cópias de seus dados fora de seu ambiente da AWS, e os dados permanecem sob seu controle. Além disso, o Ground Truth oferece suporte a padrões de conformidade, como o RGPD (Regulamento Geral sobre a Proteção de Dados), e fornece recursos abrangentes de registro em log e auditoria usando o Amazon CloudWatch e o Amazon CloudTrail. Acesse a documentação do Amazon SageMaker Ground Truth para obter mais informações.  

P: Como faço para acessar uma força de trabalho humana usando o Amazon SageMaker Ground Truth?

R: Por meio do SageMaker Ground Truth, é possível escolher qualquer uma das três opções de força de trabalho, nomeadamente: (1) força de trabalho colaborativa pública por meio do Amazon Mechanical Turk; (2) fornecedores de terceiros disponíveis no AWS Marketplace e (3) seus próprios funcionários. Acesse a documentação do Amazon SageMaker Ground Truth para obter mais informações.  

Definição de preço e disponibilidade

P: Quanto custa o Amazon SageMaker Ground Truth?

R: Consulte a página Definição de preço do SageMaker Ground Truth para conhecer as informações sobre a definição de preços atuais.

P: Em quais regiões da AWS o Amazon SageMaker Ground Truth está disponível?

R: O Amazon SageMaker Ground Truth está atualmente disponível nas regiões da AWS no Norte da Virginia, Ohio, Oregon, Irlanda e Tóquio.

Product-Page_Standard-Icons_01_Product-Features_SqInk
Saiba mais sobre a definição de preço para o Amazon SageMaker Ground Truth

Comece a usar o Amazon SageMaker Ground Truth sem compromissos iniciais ou contratos de longo prazo. Para obter mais detalhes, confira a página Definição de preço para o Amazon SageMaker Ground Truth.

Product-Page_Standard-Icons_02_Sign-Up_SqInk
Cadastre-se para obter uma conta gratuita

Obtenha acesso instantâneo ao nível gratuito da AWS. 

Cadastrar-se 
Product-Page_Standard-Icons_03_Start-Building_SqInk
Comece a criar no console

Comece a criar com o Amazon SageMaker Ground Truth no Console de Gerenciamento da AWS.

Faça login