O Amazon SageMaker Ground Truth ajuda você a criar conjuntos de dados de treinamento para machine learning. O Ground Truth rotulará seu conteúdo (imagens, áudio, texto, etc.) guiando um rotulador humano passo a passo em um processo chamado fluxo de trabalho. Três grupos de humanos podem fornecer rótulos usando esses fluxos de trabalho: operadores do Amazon Mechanical Turk, seus funcionários ou fornecedores terceirizados. O Ground Truth também pode aprender com esses rótulos e rotular objetos automaticamente.  

Você paga por cada objeto rotulado (que pode ser uma imagem, gravação de áudio, seção de texto etc.), seja ele rotulado automaticamente pelo Ground Truth ou por um rotulador humano. Se você usa um fornecedor ou Mechanical Turk para fornecer rótulos, paga um custo adicional por objeto rotulado. Se você usar seus funcionários para rotular, não haverá custo adicional por objeto rotulado. 

Detalhes da definição de preço

Você é cobrado pelo número de objetos de conjunto de dados rotulados. Um objeto de conjunto de dados é definido como uma unidade atômica de dados e pode incluir imagens, quadros de vídeo, documentos de texto, arquivos de áudio etc.

Nuvens de pontos 3D

Definição de preço do fluxo de trabalho interno para rotulagem com o Amazon Mechanical Turk

Se você usa um fornecedor, o custo por rótulo é definido pelo fornecedor. Você pode ver os detalhes de preços de cada fornecedor no AWS Marketplace. Se você usar o Amazon Mechanical Turk para rotular, será cobrado por objeto, por rotulador. Recomendamos que você use vários rotuladores por objeto para melhorar a precisão do rótulo. 

Nível gratuito

Como parte do nível gratuito da AWS, você pode começar a usar o Amazon SageMaker gratuitamente. Nos primeiros dois meses após o primeiro uso do Amazon SageMaker, seus primeiros 500 objetos rotulados por mês são gratuitos (excluindo quaisquer custos adicionais incorridos pelo uso de um fornecedor de rotulagem ou do Amazon Mechanical Turk).

Exemplos de definição de preço

Usar funcionários internos para rotulagem humana

Uma empresa de manufatura usa machine learning para classificar as imagens de seus produtos. Para treinar o modelo, eles rotulam 40.000 imagens com nomes de produtos. Usando o fluxo de trabalho interno para classificação de imagens, seus funcionários rotulam todas as 40.000 imagens.

Como a empresa usava funcionários internos, o preço das 40 mil imagens rotuladas por humanos são os mesmo 0,08 USD por imagem.

Custo total = 40.000 imagens rotuladas por humanos x 0,08 USD por imagem = 3.200 USD

Usar o Mechanical Turk para rotulagem humana com um fluxo de trabalho personalizado

Uma empresa de publicidade usa machine learning para determinar o sentimento e o conteúdo das postagens de mídias sociais. Para treinar o modelo, eles decidem rotular 85.000 postagens. Eles decidem criar e carregar um fluxo de trabalho personalizado e definir um pagamento de 0,036 USD. Eles também decidem rotular cada publicação três vezes para melhorar a precisão dos rótulos. Usando o SageMaker Ground Truth, os humanos rotulam 85.000 publicações.

Como a empresa usava o Mechanical Turk, o custo incluía uma taxa adicional de 0,036 USD para cada publicação rotulada por humanos para pagar o rotulador.

Custo total = (50.000 x 0,08 USD por artigo) + (35.000 publicação x 0,04 USD por publicação) + (85.000 publicações rotuladas por humanos x 0,036 USD por publicação x 3 rotuladores por objeto) = 14.580 USD

Usar o Mechanical Turk para rotulagem humana com um fluxo de trabalho interno

Uma editora usa machine learning para criar um aplicativo de processamento de idioma natural para classificar artigos de jornal. Para treinar o modelo, eles rotulam 200.000 artigos. Eles selecionam o fluxo de trabalho de classificação de texto interno e decidem rotular cada artigo três vezes para melhorar a precisão dos rótulos. Usando o SageMaker Ground Truth, os humanos rotulam 40.000 artigos e 160.000 são rotulados automaticamente.

Como a empresa usava o Mechanical Turk, o fluxo de trabalho de classificação de textos incluía uma taxa adicional de 0,012 USD para cada artigo rotulado por humanos para pagar o rotulador.

Custo total = (50.000 x 0,08 USD por artigo) + (150.000 artigos x 0,04 USD por artigo) + (40.000 artigos rotulados por humanos x 0,012 USD por artigo x 3 rotuladores por objeto) + custos de treinamento e inferência do Amazon SageMaker** = 11.440 USD + custos de treinamento e inferência do Amazon SageMaker**

**Esses custos dependem de diversos fatores, incluindo o tipo de conjunto de dados utilizado, o tipo de tarefa de rotulagem e a resolução das imagens no conjunto de dados.

Recursos adicionais de definição de preço

Calculadora de definição de preço da AWS

Calcule facilmente os custos mensais na AWS

Centro de recursos de fatores econômicos

Recursos adicionais para mudar para a AWS

Product-Page_Standard-Icons_01_Product-Features_SqInk
Consulte a documentação do Amazon SageMaker Ground Truth

Saiba como o Amazon SageMaker Ground Truth pode ajudar você a criar conjuntos de dados de treinamento de alta qualidade com maior precisão e a reduzir os custos de rotulagem de dados em até 70%.

Leia a documentação 
Product-Page_Standard-Icons_02_Sign-Up_SqInk
Cadastre-se para obter uma conta gratuita

Obtenha acesso instantâneo ao nível gratuito da AWS. 

Cadastre-se 
Product-Page_Standard-Icons_03_Start-Building_SqInk
Comece a criar no console

Comece a criar com o Amazon SageMaker Ground Truth no Console de Gerenciamento da AWS.

Faça login