Amazon SageMaker Ground Truth Plus

Geral

P: O que é o Amazon SageMaker Ground Truth Plus?

O Amazon SageMaker Ground Truth Plus permite que você crie facilmente conjuntos de dados de treinamento de alta qualidade sem ter de criar aplicações de rotulagem ou gerenciar o quadro de funcionários para rotulagem. Depois de fornecer os dados junto com os requisitos de rotulagem, o SageMaker Ground Truth Plus lida com a configuração dos fluxos de trabalho de rotulagem de dados e os gerencia para você, conforme suas necessidades. A partir daí, um quadro de funcionários especializado treinado em diversas tarefas de machine learning (ML) faz a rotulagem de dados. O Ground Truth Plus usa técnicas de ML, incluindo aprendizado ativo, pré-rotulagem e validação de máquina. Isso aumenta a qualidade do conjunto de dados de saída e diminui os custos de rotulagem de dados. O Ground Truth Plus fornece transparência em suas operações de rotulagem de dados e gerenciamento de qualidade. Com ele, você pode revisar o andamento dos conjuntos de dados de treinamento em vários projetos, acompanhar as métricas do projeto, como taxa de transferência diária, inspecionar a qualidade dos rótulos e fornecer feedback sobre os dados rotulados. O Ground Truth Plus pode ser usado para uma variedade de casos de uso, incluindo visão computacional, processamento de linguagem natural e reconhecimento de fala.

P: Por que devo usar o Amazon SageMaker Ground Truth Plus?

Para treinar um modelo de machine learning (ML), os cientistas de dados precisam de grandes conjuntos de dados rotulados e com alta qualidade. À medida que a adoção do ML aumenta, as necessidades de rotulagem aumentam. Isso força os cientistas de dados a passar semanas criando fluxos de trabalho de rotulagem de dados e gerenciando um quadro de funcionários de rotulagem de dados. Infelizmente, isso retarda a inovação e aumenta os custos. Para que os cientistas de dados consigam investir seu tempo criando, treinando e implantando modelos de ML, normalmente eles encarregam outras equipes internas, que consistem em gerentes de operações de dados e gerentes de programa, de produzir conjuntos de dados de treinamento de alta qualidade. No entanto, essas equipes normalmente não têm acesso às habilidades necessárias para fornecer conjuntos de dados de treinamento de alta qualidade, o que afeta os resultados de ML.

Para cientistas de dados, bem como gerentes de negócios, como gerentes de operações de dados e gerentes de programa, o Amazon SageMaker Ground Truth Plus facilita a criação de conjuntos de dados de treinamento de alta qualidade, removendo o trabalho pesado indiferenciado associado à criação de aplicações de rotulagem de dados e gerenciamento do quadro de funcionários de rotulagem. Tudo o que você faz é compartilhar dados junto com os requisitos de rotulagem e Ground Truth Plus configura e gerencia seu fluxo de trabalho de rotulagem de dados, com base nesses requisitos. A partir daí, um quadro de funcionários especializado, treinada em uma variedade de tarefas de ML, realiza a rotulagem de dados. Você nem mesmo precisa de sólida experiência em ML ou conhecimento de design de fluxo de trabalho e gerenciamento de qualidade para usar o Ground Truth Plus.

P: Como faço para começar a usar o Amazon SageMaker Ground Truth Plus?

Para começar a usar o Amazon SageMaker Ground Truth Plus, preencha o formulário de requisitos do projeto. Nossa equipe entrará em contato com você para falar sobre seu projeto de rotulagem de dados.

P: Como o Amazon SageMaker Ground Truth Plus me ajuda a gerenciar meus conjuntos de dados de treinamento?

O Amazon SageMaker Ground Truth Plus oferece maior transparência nas operações de rotulagem de dados e gerenciamento de qualidade. Por exemplo, o SageMaker Ground Truth Plus fornece uma visão do projeto, que você pode usar para monitorar o progresso do conjunto de dados de treinamento em diferentes projetos. Além disso, um painel de métricas em tempo real permite que você acompanhe as métricas detalhadas do projeto, incluindo a taxa de transferência diária. O SageMaker Ground Truth Plus também fornece uma interface de usuário que permite inspecionar a qualidade dos rótulos e fornecer feedback em tempo real. Por fim, com o modo de transmissão, você pode obter retorno de rótulo no mesmo dia ou na mesma hora para certos tipos de workload.

P: Como o Amazon SageMaker Ground Truth Plus ajuda a aumentar a precisão dos conjuntos de dados de treinamento?

O Ground Truth Plus usa várias técnicas para aumentar a precisão do conjunto de dados de treinamento:

  • Técnicas de ML: o Ground Truth Plus usa técnicas de ML, incluindo aprendizado ativo, pré-rotulagem e validação de máquina, o que aumenta a qualidade do conjunto de dados de saída e diminui os custos de rotulagem de dados. Um fluxo de trabalho de rotulagem de várias etapas inclui modelos de ML para aprendizado ativo que permite ao Ground Truth Plus reduzir custos, selecionando os itens que devem ser rotulados e os modelos de ML que devem pré-rotular dados selecionados que reduzem o esforço humano. O Ground Truth Plus usa validação de máquina para identificar erros potenciais que são então enviados a uma etapa adicional de revisão humana. Isso melhora significativamente a qualidade do rótulo ao detectar erros humanos.
  • Interface de rotulagem intuitiva: o Ground Truth Plus usa recursos de rotulagem auxiliares, como (1) Snapping (Encaixe), que encaixa um cuboide 3D imperfeito para cobrir totalmente o objeto abrangente. (2) Auto-Segmentation (Segmentação automática), que completa uma máscara de objeto com apenas quatro cliques em pontos extremos.

Privacidade de dados

P: Como o Amazon SageMaker Ground Truth Plus ajuda a oferecer proteção e segurança a meus dados?

Por padrão, o Amazon SageMaker Ground Truth Plus criptografa os dados armazenados em um bucket do Amazon S3 em repouso e em trânsito. Além disso, o acesso a seus dados é controlado usando o AWS Identity and Access Management (IAM). Seus dados são armazenados em uma conta da AWS independente e um bucket do Amazon S3 é criado para o seu projeto. O Amazon SageMaker Ground Truth Plus não armazena nem faz cópias de seus dados fora do ambiente AWS criado para você. A AWS registra e audita todo o acesso aos seus dados usando o registro de acesso do Amazon S3 e o AWS CloudTrail.

P: Quem tem acesso a meu conteúdo que é processado e armazenado pelo Amazon SageMaker Ground Truth Plus?

Os funcionários autorizados da AWS e o quadro de funcionários especializado que rotulam seus dados terão acesso ao conteúdo processado pelo Amazon SageMaker Ground Truth Plus. O quadro de funcionários especializado que rotula seus dados visualiza e rotula os dados pelo portal seguro do operador do SageMaker Ground Truth. O acesso por meio do portal do operador permite que os operadores apenas visualizem e rotulem os dados, eles não podem modificá-los ou exclui-los. Sua confiança, privacidade e segurança são nossa maior prioridade. Implementamos controles técnicos e físicos apropriados, incluindo criptografia em repouso e em trânsito, projetados para impedir o acesso não autorizado ou a divulgação de seu conteúdo.

P: As entradas de dados (imagens, arquivos de texto, vídeos etc.) são processadas pelo Amazon SageMaker Ground Truth Plus? E como são usadas pela AWS?

O Amazon SageMaker Ground Truth Plus armazena o conteúdo bruto e processado apenas pela duração de seus projetos e excluirá o conteúdo associado a seu projeto de rotulagem de dados mediante solicitação. O Amazon SageMaker Ground Truth Plus usa seu conteúdo exclusivamente para fornecer e fazer manutenção do serviço. O Amazon SageMaker Ground Truth Plus nunca usa seu conteúdo ou qualquer modelo treinado nesse conteúdo para o benefício de outros clientes.

P: O conteúdo processado pelo Amazon SageMaker Ground Truth Plus é transferido para fora da região da AWS em que estou usando o Amazon SageMaker Ground Truth Plus?

Qualquer conteúdo processado pelo Amazon SageMaker Ground Truth Plus é criptografado e armazenado em repouso na região da AWS em que você está usando o Amazon SageMaker Ground Truth Plus. A menos que você especifique o contrário em quaisquer requisitos de localização de dados mutuamente acordados por meio de uma declaração de trabalho, seu conteúdo poderá ser acessado fora da região da AWS em que seu conteúdo está armazenado para executar o serviço de rotulagem.

P: Posso solicitar a exclusão de dados (imagens, arquivos de texto, vídeos etc.) armazenados pelo Amazon SageMaker Ground Truth Plus?

Sim. Você pode solicitar a exclusão de entradas de dados brutos e processados associados ao projeto de rotulagem de dados entrando em contato com o AWS Support.

P: Ainda sou o proprietário de meu conteúdo que é processado e armazenado pelo Amazon SageMaker Ground Truth Plus?

Sim. Você sempre retém a propriedade do conteúdo. Só usaremos seu conteúdo com seu consentimento.

P: Posso processar dados de informações pessoais de saúde (PHI) pelo Amazon SageMaker Ground Truth Plus?

Não. Atualmente, o Amazon SageMaker Ground Truth Plus não é um serviço qualificado para HIPAA.

Quadro de funcionários

P: O que é um quadro de funcionários especializado no Amazon SageMaker Ground Truth Plus?

Com o Ground Truth Plus, a rotulagem é feita por um quadro de funcionários altamente qualificado, diversificado e elástico, treinado em tarefas de machine learning que podem ajudar a atender a uma ampla variedade de suas necessidades, incluindo segurança de dados, privacidade e conformidade. O quadro de funcionários consiste em dois níveis, 1/Quadro de funcionários da Amazon: consiste em operadores que são empregados e gerenciados pela Amazon, em que a Amazon possui os SLAs de operações, qualidade e tempo de resposta em seu nome. 2/Quadro de funcionários do fornecedor: consiste em operadores fornecidos por uma lista selecionada de fornecedores terceirizados especializados em fornecer serviços de rotulagem de dados, em que a Amazon possui os SLAs de qualidade e tempo de resposta em seu nome.

P: Quem decide qual nível de quadro de funcionários será usado para o meu projeto do Amazon SageMaker Ground Truth Plus?

Você pode decidir o tipo de quadro de funcionários a ser usado em seu projeto. A menos que você nos instrua a usar um quadro de funcionários específico, podemos usar o quadro de funcionários da Amazon, o quadro de funcionários do fornecedor ou uma combinação de ambos para ajudar a atender às necessidades de qualidade, tempo de resposta e segurança do seu projeto.

P: Quais mudanças o quadro de funcionários do fornecedor está implementando à luz da COVID-19 e das quais preciso estar ciente?

À luz da COVID-19, alguns prestadores de serviço implementaram uma política de trabalho remoto para a saúde e segurança dos funcionários.

P: A quais padrões de segurança um quadro de funcionários do fornecedor deve atender?

Os prestadores de serviços são obrigados a passar por uma conformidade SOC 2 ou certificação ISO 27001 realizada anualmente por um auditor terceirizado independente.

O relatório SOC 2 é uma descrição do ambiente de controle do prestador de serviços baseado nos critérios de serviços confiáveis do American Institute of Certified Public Accountants (AICPA): segurança, disponibilidade, integridade do processamento, confidencialidade e privacidade.

A certificação ISO 27001 é baseada na Organização Internacional de Normalização (ISO) e na Comissão Eletrotécnica Internacional (IEC), que detalha os requisitos para estabelecer, implementar, manter e melhorar continuamente um sistema de gerenciamento de segurança da informação (SGSI).

Além de obter o SOC 2 ou ISO 27001 de forma independente, os prestadores de serviços devem a manter controles de segurança adicionais, os quais estão descritos abaixo, para ajudar a manter seus dados protegidos.

Controles tecnológicos:
Os prestadores de serviços são obrigados a utilizar o software apropriado para bloquear quaisquer tentativas de download ou cópia de arquivos/dados realizadas no sistema deles e impedir o acesso não autorizado a seus sistemas. Os prestadores de serviços também são obrigados a proibir o quadro de funcionários de armazenar ou copiar dados relacionados a tarefas do cliente.

Controles de segurança da rede:
Exigimos que a rede do prestador de serviços seja projetada para evitar acesso remoto aos dados relacionados a tarefas do cliente. Além disso, o software de compartilhamento de arquivos ponto a ponto é bloqueado na rede do prestador, e o firewall deve ser projetado para proporcionar alta disponibilidade.

Controles de funcionários:
Os prestadores de serviços precisam ter Contratos de Não Divulgação (NDAs) com seus funcionários. Os prestadores de serviços são obrigados a adotar políticas rigorosas para impedir o vazamento de qualquer informação e impedir que funcionários transmitam informações por quaisquer meios: papel, pen-drives, telefones celulares ou qualquer outro meio.

Controle de acesso físico:
Os prestadores de serviços são obrigados a manter medidas de controle de acesso físico para impedir o acesso não autorizado ao local de produção. Essas medidas podem incluir catracas com autenticação biométrica, identificação de funcionários por crachás etc.

P: Como a AWS ajuda o quadro de funcionários de um fornecedor a atender a esses padrões de segurança?

A AWS solicita que os prestadores de serviço forneçam seus relatórios de certificação SOC 2 ou ISO 27001 antes de se tornarem parte do quadro de funcionários do fornecedor do Amazon SageMaker Ground Truth Plus. Os relatórios SOC da AWS e as certificações ISO não abrangem o quadro de funcionários do fornecedor.

Amazon SageMaker Ground Truth

Geral

P: O que é o Amazon SageMaker Ground Truth?

O Amazon SageMaker Ground Truth facilita a rotulagem eficiente e precisa dos conjuntos de dados necessários para o treinamento de sistemas de machine learning. O SageMaker Ground Truth pode rotular automaticamente uma parte do conjunto de dados com base nos rótulos feitos manualmente por pessoas responsáveis pela rotulagem. É possível optar por usar uma força de trabalho colaborativa do Amazon Mechanical Turk com mais de 500.000 pessoas responsáveis pela rotulagem, seus próprios funcionários, ou por um dos provedores de serviços de rotulagem de dados pré-aprovados pela Amazon e listados no AWS Marketplace. O SageMaker Ground Truth usa algoritmos inovadores e técnicas de experiência do usuário (UX) para melhorar a precisão da rotulagem humana. Com o tempo, o modelo fica cada vez melhor ao aprender continuamente com os rótulos criados por humanos, para aumentar a rotulagem automática.

P: O que é a rotulagem de dados automatizada?

A rotulagem de dados automatizada é a ação de rotular os dados usando machine learning. Primeiro, o Amazon SageMaker Ground Truth selecionará uma amostra aleatória de dados e a enviará para rotulagem por humanos. Os resultados serão usados para treinar um modelo de rotulagem que tentará rotular uma nova amostra de dados brutos automaticamente. Os rótulos serão confirmados quando o modelo conseguir rotulá-los com uma pontuação de confiança que atenda ou exceda um limite alto. Quando a pontuação de confiança ficar abaixo desse limite, os dados serão enviados para as pessoas responsáveis pela rotulagem. Alguns dos dados rotulados por pessoas serão usados para gerar um novo conjunto de dados de treinamento para o modelo de rotulagem, e o modelo será automaticamente treinado mais uma vez para melhorar a precisão. Esse processo se repete a cada amostra de dados brutos a ser rotulada. O modelo de rotulagem se tornará mais capaz de rotular automaticamente dados brutos em cada iteração, e menos dados serão encaminhados para pessoas.

Como usar o Amazon SageMaker Ground Truth

P: Por que devo usar o Amazon SageMaker Ground Truth?

Antes de criar, treinar e implantar modelos de machine learning, você precisará de dados. Os modelos bem-sucedidos são criados com base em dados de treinamento de alta qualidade, e coletar e rotular os conjuntos de dados de treinamento envolve muito tempo e esforço. Para criar os conjuntos de dados de treinamento, as pessoas responsáveis pela rotulagem precisam avaliar um grande número de imagens ou outros tipos de dados e, em seguida, identificar e rotular determinados objetos em cada tipo de dados. Essas tarefas de rotulagem são distribuídas entre muitas pessoas, gerando sobrecarga e custo significativos. Se houver rótulos incorretos, o sistema aprenderá com as informações incorretas e fará previsões imprecisas.

O Amazon SageMaker Ground Truth resolve esse problema facilitando a execução eficiente da rotulagem de dados altamente precisa, usando dados armazenados no Amazon S3, uma combinação de rotulagem de dados automatizada e rotulagem realizada por humanos.

P: Como posso começar a usar o Amazon SageMaker Ground Truth?

O Amazon SageMaker Ground Truth fornece uma experiência gerenciada na qual é possível configurar uma tarefa completa de rotulagem de dados em poucas etapas. Para começar a usar o Amazon SageMaker Ground Truth, faça login no Console de Gerenciamento da AWS e navegue até o console do SageMaker. Neste ponto, selecione Labeling jobs em Ground Truth. Crie uma tarefa de rotulagem. Primeiro, como parte do fluxo de criação da tarefa de rotulagem, você fornece um ponteiro para o bucket do S3 que contém o conjunto de dados a ser rotulado. O Ground Truth oferece modelos para tarefas comuns de rotulagem, bastando clicar em algumas opções e fornecer instruções mínimas sobre como rotular os dados. Como alternativa, crie seu próprio modelo personalizado. Como última etapa da criação de uma tarefa de rotulagem, você seleciona uma das três opções de força de trabalho humana: (1) uma força de trabalho colaborativa pública, (2) um conjunto selecionado de provedores de serviços de rotulagem de dados e (3) use seus próprios funcionários. Além disso, há a opção de habilitar a rotulagem de dados automatizada.

P: Como meus conjuntos de dados de treinamento são gerenciados usando o Amazon SageMaker Ground Truth?

O Amazon SageMaker Ground Truth gerencia os metadados, os rótulos associados e uma taxonomia de seus rótulos e conjuntos de dados. É possível usar facilmente o AWS SDK por meio de um bloco de anotações do SageMaker ou do console do Ground Truth no console do SageMaker para consultar e gerenciar conjuntos de dados e rótulos. Acesse a documentação do Amazon SageMaker Ground Truth para obter mais informações.

P: Como o Amazon SageMaker Ground Truth ajuda a aumentar a precisão dos conjuntos de dados de treinamento?

O Amazon SageMaker Ground Truth oferece os seguintes recursos para ajudar os clientes a aumentar a precisão da rotulagem de dados realizada por humanos:

(a) Consolidação de anotações:isso neutraliza erros/preferências de operadores individuais enviando cada objeto de dados a vários funcionários e consolidando as respostas deles (chamadas de “anotações”) em um único rótulo. Em seguida, ele pega essas anotações e compara-as usando um algoritmo de consolidação de anotações. Esse algoritmo primeiro detecta anotações discrepantes que são desconsideradas. Em seguida, realiza uma consolidação ponderada das anotações, atribuindo pesos mais altos a anotações mais confiáveis. A saída é um rótulo único para cada objeto.

(b) Melhores práticas da interface de anotações: são os recursos das interfaces de anotações que permitem que os operadores realizem as tarefas com mais precisão. Operadores humanos são propensos a erros e preferências, e interfaces bem projetadas melhoram a precisão do operador. Uma melhor prática é exibir breves instruções juntamente com exemplos de rótulos bons e ruins em um painel lateral fixo. Outra melhor prática recomendada é escurecer a área fora do limite da caixa delimitadora quando os operadores estiverem desenhando a caixa delimitadora em uma imagem.

P: Como o Amazon SageMaker Ground Truth garante a proteção e a segurança dos meus dados?

Por padrão, o Amazon SageMaker Ground Truth criptografa seus dados em repouso e em trânsito. Além disso, o acesso a seus dados pode ser controlado usando o AWS Identity and Access Management (IAM). O Ground Truth não armazena nem faz cópias de seus dados fora de seu ambiente da AWS, e os dados permanecem sob seu controle. Além disso, o Ground Truth oferece suporte a padrões de conformidade, como o Regulamento geral de proteção de dados (GDPR), e fornece recursos abrangentes de registro em log e auditoria usando o Amazon CloudWatch e o Amazon CloudTrail. Acesse a documentação do Amazon SageMaker Ground Truth para obter mais informações.

P: Como faço para acessar uma força de trabalho humana usando o Amazon SageMaker Ground Truth?

Por meio do SageMaker Ground Truth, é possível escolher qualquer uma das três opções de mão de obra: (1) mão de obra colaborativa pública por meio do Amazon Mechanical Turk; (2) prestadores de serviços de rotulagem de dados disponíveis no AWS Marketplace e (3) seus próprios funcionários. Acesse a documentação do Amazon SageMaker Ground Truth para obter mais informações.  

Uso de provedores de serviços terceirizado de rotulagem de dados

P: O prestador de serviços de rotulagem de dados do Amazon SageMaker Ground Truth pode processar dados confidenciais?

Sim, os prestadores de serviços de rotulagem de dados do Amazon SageMaker Ground Truth podem processar dados confidenciais. O contrato padrão do serviço entre os clientes da AWS e o prestador de serviços terceirizado de rotulagem de dados contém algumas proteções básicas para suas informações confidenciais. Analise esses termos antes de compartilhar qualquer informação confidencial com o prestador de serviços. Os termos estão localizados na página de ofertas do provedor de serviços no AWS Marketplace.

Q:   Estou trabalhando com um provedor de serviços terceirizado por meio do AWS Marketplace. Quais alterações os provedores de serviço estão implementando frente à COVID-19 e que eu deva tomar ciência?

R: Frente ao impacto em rápida expansão da COVID-19, alguns prestadores de serviços implementaram temporariamente uma política de trabalho remoto para proteger a saúde e a segurança dos funcionários. Durante esse período, os padrões de segurança, inclusive conformidade com SOC 2 e outros controles de segurança descritos nas perguntas e respostas abaixo, podem não ser aplicáveis aos prestadores de serviço afetados. Os prestadores de serviços afetados atualizaram as respectivas ofertas no AWS Marketplace a fim de refletir essa situação e não processarão dados do cliente em ambientes de trabalho remoto sem o consentimento explícito do cliente.

P: Quais padrões de segurança os provedores de serviço de rotulagem de dados do Amazon SageMaker Ground Truth são obrigados a atender?

Os prestadores de serviços de rotulagem de dados são obrigados a manter a conformidade com a SOC 2 e obter a certificação anualmente. O relatório SOC 2 é uma descrição do ambiente de controle do prestador de serviços baseado nos critérios de serviços confiáveis do American Institute of Certified Public Accountants (AICPA): segurança, disponibilidade, integridade do processamento, confidencialidade e privacidade.

Além do SOC 2, os prestadores de serviços são obrigados a manter esses controles de segurança adicionais para ajudar a manter os dados do cliente seguros.

Controles tecnológicos:
Os prestadores de serviços são obrigados a utilizar o software apropriado para bloquear quaisquer tentativas de download ou cópia de arquivos/dados realizadas no sistema deles e impedir o acesso não autorizado aos demais sistemas. Os prestadores de serviços também são obrigados a proibir sua mão de obra de armazenar ou copiar dados relacionados a tarefas do cliente.

Controles de segurança da rede:
Exigimos que a rede do prestador de serviços seja projetada para evitar acesso remoto aos dados relacionados a tarefas do cliente. Além disso, o software de compartilhamento ponto a ponto é bloqueado na rede do prestador, e o firewall deve ser projetado para proporcionar alta disponibilidade.

Controles de funcionários:
Os prestadores de serviços precisam garantir que tenham Contratos de Não Divulgação (NDAs) com seus funcionários. Os prestadores de serviços são obrigados a adotar políticas rigorosas para impedir o vazamento de qualquer informação e impedir que funcionários transmitam informações por quaisquer meios: papel, pen-drives, celulares ou qualquer outro meio.

Controle de acesso físico:
Os prestadores de serviços são obrigados a manter medidas de controle de acesso físico para impedir o acesso não autorizado ao local de produção. Podem incluir catracas com autenticação biométrica, identificação de funcionários por crachás etc.

P: Como a AWS ajuda a garantir que os prestadores de serviços cumpram essas normas de segurança?

A AWS solicita que os prestadores de serviços forneçam os relatórios da certificação SOC 2 antes de serem anunciados no Marketplace e confirma:

a autenticidade (se o auditor do prestador de serviços é certificado pela AICPA);

o período do relatório (data de validade da certificação SOC 2); e

o local de produção (o local físico em que a mão de obra do prestador de serviços trabalhará nas tarefas de rotulagem do Amazon SageMaker Ground Truth).

P: Qual a frequência da análise das normas de segurança do prestador de serviços?

As normas de segurança de todos os prestadores de serviços são revisadas anualmente para garantir que cumprem os requisitos obrigatórios.

P:   Há alguma exceção na análise da AWS?

Não. Se o prestador de serviços deixar de cumprir normas de segurança, seu anúncio será removido do AWS Marketplace. A remoção do anúncio será concluída em 24 horas, e todos os clientes ativos serão notificados por e-mail.

P:   Se o prestador de serviços oferecer serviços de rotulagem de dados por meio de vários locais de produção, todos os locais precisam passar pelo processo de análise?

Sim, todos os locais precisam atender às normas de segurança exigidas.

P: O que acontece se houver uma violação de dados no local de produção do prestador de serviços?

O prestador de serviços informará a AWS e os clientes afetados dentro de 24 horas após a detecção de qualquer confirmação ou suspeita de acesso não autorizado, coleta, aquisição, uso, transmissão, divulgação, corrupção ou perda de informações do cliente. O prestador de serviços remediará prontamente cada incidente de segurança e fornecerá à AWS e aos clientes afetados detalhes por escrito sobre a investigação interna.

Definição de preço e disponibilidade

P: Quanto custa o Amazon SageMaker Ground Truth?

Consulte a página de preços do SageMaker Ground Truth para obter as informações atuais sobre preços.

P: Em quais regiões da AWS o Amazon SageMaker Ground Truth está disponível?

A tabela de regiões da AWS lista todas as regiões da AWS em que o Amazon SageMaker Ground Truth está disponível no momento.

Geração de dados sintéticos

P: Como posso gerar dados sintéticos rotulados?

O Amazon SageMaker Ground Truth pode gerar dados sintéticos rotulados para você. Especifique seus requisitos de imagem sintética ou forneça ativos 3D e imagens de referências, como imagens de desenho assistido por computador (CAD), e os artistas digitais da AWS criarão imagens do zero ou usarão ativos fornecidos pelo cliente. As imagens geradas imitam a pose e o posicionamento de objetos, incluem variações de objetos ou de cenas e, opcionalmente, adicionam elementos específicos, como arranhões, amassados e outras alterações, eliminando o processo oneroso de coleta de dados ou a necessidade de danificar peças para obter imagens. O SageMaker Ground Truth pode gerar centenas de milhares de imagens sintéticas que são rotuladas automaticamente com alta precisão.

P: Por que usar dados sintéticos rotulados?

O fornecimento de dados para treinamento de modelos de machine learning (ML) consome tempo e esforços consideráveis. Em alguns tipos de dados, como cenários raros ou altamente variáveis, a coleta de dados pode ser cara ou até impossível. Por exemplo, identificar defeitos de fabricação requer uma grande quantidade de imagens. Além disso, os modelos de ML precisam ser treinados para reconhecer cenários que não ocorrem com frequência, como defeitos raros. Para identificar defeitos raros, os modelos de ML precisam de imagens de defeitos. Mas, como esses eventos ocorrem esporadicamente, muitas vezes esses dados são criados manualmente, o que pode exigir danificar peças caras. Por fim, as imagens precisam ser rotuladas manualmente.

Com o SageMaker Ground Truth, você pode gerar dados sintéticos que são rotulados automaticamente, reduzindo o tempo e as despesas envolvidas na coleta e na rotulagem de dados de treinamento. É possível usar dados sintéticos para treinar modelos de ML em uma ampla gama de casos de uso de visão computacional, como detecção de objetos, anomalias e defeitos.

P: Como o SageMaker Ground Truth pode gerar dados sintéticos rotulados?

Há um processo de três etapas para gerar dados sintéticos rotulados. Primeiro, você fornece ativos 3D, imagens de referência ou requisitos de imagem. Segundo, artistas digitais convertem essas entradas em ativos 3D, adicionando elementos como arranhões, amassados e texturas. Terceiro, o SageMaker Ground Truth gera imagens sintéticas e as rotula automaticamente.

P: Posso usar o SageMaker Ground Truth para gerar dados sintéticos rotulados, caso não tenha imagens ou recursos 3D?

Sim, há uma biblioteca de ativos 3D com mais de 1 milhão de objetos que podem ser usados para auxiliar a criação de dados sintéticos em seu nome. Se preferir, você pode usar um pequeno conjunto de imagens pré-rotuladas para criar conjuntos de dados sintéticos. Caso você tenha imagens de plano de fundo ou exemplos dos dados necessários, isso poderá agilizar a criação de dados sintéticos altamente precisos.

Preço do Amazon SageMaker Ground Truth
Saiba mais sobre os preços da rotulagem de dados do Amazon SageMaker

Comece a usar a rotulagem de dados do Amazon SageMaker sem compromissos antecipados ou contratos de longo prazo.

Saiba mais 
Cadastre-se para obter uma conta da AWS
Cadastre-se para obter uma conta gratuita

Obtenha acesso instantâneo ao nível gratuito da AWS. 

Cadastrar-se 
Comece a criar no console
Comece a criar no console

Comece a criar com a rotulagem de dados do Amazon SageMaker no Console de Gerenciamento da AWS.

Faça login