Publicado: Dec 1, 2021
Hoje, temos o prazer de anunciar a disponibilidade geral do Amazon SageMaker Ground Truth Plus, um novo serviço de rotulagem de dados pronto para uso que permite criar conjuntos de dados de treinamento de alta qualidade rapidamente e reduzir os custos em até 40%.
Para treinar um modelo de machine learning (ML), os cientistas de dados precisam de grandes conjuntos de dados rotulados e com alta qualidade. À medida que a adoção do ML aumenta, as necessidades de rotulagem aumentam. Isso força os cientistas de dados a passar semanas criando fluxos de trabalho de rotulagem de dados e gerenciando um quadro de funcionários de rotulagem de dados. Infelizmente, isso retarda a inovação e aumenta os custos. Para que os cientistas de dados consigam investir seu tempo criando, treinando e implantando modelos de ML, normalmente eles encarregam outras equipes internas, que consistem em gerentes de operações de dados e gerentes de programa, de produzir conjuntos de dados de treinamento de alta qualidade. No entanto, essas equipes normalmente não têm acesso às habilidades necessárias para fornecer conjuntos de dados de treinamento de alta qualidade, o que afeta os resultados de ML. E se você pudesse contar com um serviço pronto para uso que permite criar conjuntos de dados de treinamento de alta qualidade em escala, sem consumir seus recursos internos? Acesse o Amazon SageMaker Ground Truth Plus.
Para cientistas de dados, bem como gerentes de negócios, gerentes de operações de dados e gerentes de programa, o Amazon SageMaker Ground Truth Plus facilita a criação de conjuntos de dados de treinamento de alta qualidade, removendo o trabalho pesado indiferenciado associado à construção de aplicações de rotulagem de dados e gerenciamento do quadro de funcionários de rotulagem. Tudo o que você faz é compartilhar dados junto com os requisitos de rotulagem e Ground Truth Plus configura e gerencia seu fluxo de trabalho de rotulagem de dados, com base nesses requisitos. A partir daí, um quadro de funcionários especializado, treinada em uma variedade de tarefas de ML, realiza a rotulagem de dados. Você nem mesmo precisa de profunda experiência em ML ou conhecimento de design de fluxo de trabalho e gerenciamento de qualidade para usar o Ground Truth Plus.
O Ground Truth Plus usa técnicas de ML, incluindo aprendizagem ativa, pré-etiquetagem e validação de máquina. Isso aumenta a qualidade do conjunto de dados de saída e diminui os custos de rotulagem de dados. O Ground Truth Plus fornece transparência em suas operações de rotulagem de dados e gerenciamento de qualidade. Com ele, você pode revisar o andamento dos conjuntos de dados de treinamento em vários projetos, acompanhar as métricas do projeto, como taxa de transferência diária, inspecionar a qualidade dos rótulos e fornecer feedback sobre os dados rotulados. O Ground Truth Plus pode ser usado para uma variedade de casos de uso, incluindo visão computacional, processamento de linguagem natural e reconhecimento de fala.
O Amazon SageMaker Ground Truth Plus está com disponibilidade geral hoje na região da AWS Leste dos EUA (Norte da Virgínia). Para saber mais sobre o Amazon SageMaker Ground Truth Plus, leia a publicação do blog, consulte a documentação do Ground Truth Plus e visite a página da Web de rotulagem de dados do SageMaker ou acesse o console do Ground Truth Plus para começar a usá-lo.