Amazon SageMaker Ground Truth
Crie conjuntos de dados de treinamento altamente precisos usando o Machine Learning e reduza os custos de rotulagem de dados em até 70%
O Amazon SageMaker Ground Truth ajuda você a criar conjuntos de dados de treinamento altamente precisos para tornar o Machine Learning mais rápido. O SageMaker Ground Truth oferece acesso fácil a pessoas responsáveis pela rotulagem pública e privada e fornece a elas fluxos de trabalho e interfaces integrados para tarefas comuns de rotulagem. Além disso, o SageMaker Ground Truth pode reduzir os custos de rotulagem em até 70% usando a rotulagem automática, que funciona treinando o Ground Truth com base em dados rotulados por pessoas para que o serviço aprenda a rotular os dados de forma independente.
Modelos de Machine Learning de sucesso são desenvolvidos com base em grandes volumes de dados de treinamento de alta qualidade. Contudo, o processo de criação dos dados de treinamento necessários para desenvolver esses modelos geralmente é caro, complicado e demorado. A maioria dos modelos criados atualmente requer que uma pessoa rotule manualmente os dados de forma que permita que o modelo saiba como tomar as decisões corretas. Por exemplo, criar um sistema de visão para computadores que seja confiável o bastante para identificar objetos, como semáforos, placas de Pare e pedestres, requer milhares de horas de gravação de vídeo com centenas de milhões de quadros de vídeo. É preciso que uma pessoa rotule todos os elementos de cada um desses quadros, como as ruas, outros carros e a sinalização, antes do início do desenvolvimento do modelo desejado.
O Amazon SageMaker Ground Truth reduz significativamente o tempo e o trabalho necessários para criar conjuntos de dados de treinamento para diminuir os custos. Essa redução é possível com o uso de Machine Learning para rotular automaticamente os dados. O modelo é capaz de melhorar de forma progressiva com o tempo, aprendendo de forma contínua com base em rótulos criados por pessoas.
Quando o modelo de rotulagem tiver um alto grau de confiança nos resultados, com base no que aprendeu até então, ele aplicará automaticamente os rótulos aos dados brutos. Quando o modelo de rotulagem tiver pouca confiança nos resultados, ele passará os dados para que pessoas possam fazer a rotulagem. Os rótulos gerados por pessoas serão enviados novamente para o modelo de rotulagem para que ele aprenda e melhore. Com o tempo, o SageMaker Ground Truth será capaz de rotular cada vez mais dados automaticamente e acelerar de forma substancial a criação dos conjuntos de dados de treinamento.
Benefícios
Redução dos custos de rotulagem em até 70%
O SageMaker Ground Truth usa um modelo de Machine Learning para rotular de forma automática dados brutos para produzir conjuntos de dados de treinamento de alta qualidade com rapidez e a uma fração do custo da rotulagem manual. Os dados só serão encaminhados para pessoas se o modelo de aprendizagem ativa não for capaz de rotulá-los de forma confiável. Os dados rotulados por pessoas serão então usados para treinar o modelos e aprimorá-lo. Menos dados serão enviados para pessoas na rodada seguinte de rotulagem, reduzindo os custos.
Trabalhe com pessoas responsáveis pela rotulagem pública e privada
Você pode optar por usar sua equipe de rotulagem e encaminhar as solicitações de rotulagem diretamente para ela. Como alternativa, se for preciso aumentar a escala, as opções serão fornecidas diretamente no console do Amazon SageMaker Ground Truth para trabalhar com pessoas responsáveis pela rotulagem de fora da organização. Você pode ter acesso a uma força de trabalho pública com mais de 500 mil pessoas responsáveis pela rotulagem por meio da integração com o Amazon Mechanical Turk. Como alternativa, se os dados exigirem confidencialidade ou habilidades especiais, você pode recorrer a empresas de rotulagem profissional pré-selecionadas pela Amazon.
Obtenha resultados com rapidez
O Amazon SageMaker Ground Truth ajuda a criar conjuntos de dados de treinamento de alta qualidade e precisos com rapidez. Os rótulos criados por máquina oferecem resultados consistentes com uma pontuação de confiança para cada rótulo, para que você possa entender com facilidade qual é o grau de segurança que o serviço tem de que o rótulo está correto. Os resultados de rótulos criados por pessoas são automaticamente avaliados e comparados aos critérios fornecidos por você para garantir que mais dados sejam enviados para pessoas responsáveis pela rotulagem de alta qualidade e que pessoas responsáveis pela rotulagem de baixa qualidade sejam removidas.
Como funciona
Consulte a documentação para saber como o Amazon SageMaker Ground Truth pode ajudar você a criar conjuntos de dados de treinamento de alta qualidade com maior precisão e a reduzir os custos de rotulagem de dados em até 70%.
Obtenha acesso instantâneo ao nível gratuito da AWS.
Comece a criar com o Amazon SageMaker Ground Truth no Console de Gerenciamento da AWS.