Geral

P: O que é o Amazon SageMaker Ground Truth?

R: O Amazon SageMaker Ground Truth facilita a rotulagem eficiente e precisa dos conjuntos de dados necessários para o treinamento de sistemas de Machine Learning. O SageMaker Ground Truth pode rotular automaticamente uma parte do conjunto de dados com base nos rótulos feitos manualmente por pessoas responsáveis pela rotulagem. É possível optar por usar uma força de trabalho colaborativa do Amazon Mechanical Turk com mais de 500.000 pessoas responsáveis pela rotulagem, seus próprios funcionários, ou por um dos provedores de serviços de rotulagem de dados pré-aprovados pela Amazon e listados no AWS Marketplace. O SageMaker Ground Truth usa algoritmos inovadores e técnicas de experiência do usuário (UX) para melhorar a precisão da rotulagem humana. Com o tempo, o modelo se torna progressivamente melhor ao aprender continuamente com os rótulos criados por humanos, para aumentar a rotulagem automática.

P: O que é a rotulagem de dados automatizada?

R: A rotulagem de dados automatizada é a ação de rotular os dados usando Machine Learning. Primeiro, o Amazon SageMaker Ground Truth selecionará uma amostra aleatória de dados e a enviará para as pessoas rotularem. Os resultados serão usados ​​para treinar um modelo de rotulagem que tentará rotular uma nova amostra de dados brutos automaticamente. Os rótulos serão confirmados quando o modelo conseguir rotulá-los com uma pontuação de confiança que atenda ou exceda um limite alto. Quando a pontuação de confiança ficar abaixo desse limite, os dados serão enviados para as pessoas responsáveis pela rotulagem. Alguns dos dados rotulados por pessoas serão usados ​​para gerar um novo conjunto de dados de treinamento para o modelo de rotulagem, e o modelo será automaticamente treinado mais uma vez para melhorar a precisão. Esse processo se repete a cada amostra de dados brutos a ser rotulada. O modelo de rotulagem se tornará mais capaz de rotular automaticamente dados brutos em cada iteração, e menos dados serão encaminhados para pessoas.

Como usar o Amazon SageMaker Ground Truth

P: Por que devo usar o Amazon SageMaker Ground Truth?

R: Antes de criar, treinar e implantar modelos de Machine Learning, você precisará de dados. Os modelos bem-sucedidos são criados com base em dados de treinamento de alta qualidade, e coletar e rotular os conjuntos de dados de treinamento envolve muito tempo e esforço. Para criar os conjuntos de dados de treinamento, as pessoas responsáveis pela rotulagem precisam avaliar um grande número de imagens ou outros tipos de dados e, em seguida, identificar e rotular determinados objetos em cada tipo de dados. Essas tarefas de rotulagem são distribuídas entre muitas pessoas, gerando sobrecarga e custo significativos. Se houver rótulos incorretos, o sistema aprenderá com as informações incorretas e fará previsões imprecisas.

O Amazon SageMaker Ground Truth resolve esse problema facilitando a execução eficiente da rotulagem de dados altamente precisa, usando dados armazenados no Amazon S3, uma combinação de rotulagem de dados automatizada e rotulagem realizada por humanos.

P: Como posso começar a usar o Amazon SageMaker Ground Truth?

R: O Amazon SageMaker Ground Truth fornece uma experiência gerenciada na qual é possível configurar uma tarefa completa de rotulagem de dados em apenas algumas etapas. Para começar a usar o Amazon SageMaker Ground Truth, faça login no Console de Gerenciamento da AWS e navegue até o console do SageMaker. Neste ponto, selecione Labeling jobs em Ground Truth. Crie uma tarefa de rotulagem. Primeiro, como parte do fluxo de criação da tarefa de rotulagem, você fornece um ponteiro para o bucket do S3 que contém o conjunto de dados a ser rotulado. O Ground Truth oferece modelos para tarefas comuns de rotulagem, bastando clicar em algumas opções e fornecer instruções mínimas sobre como rotular os dados. Como alternativa, crie seu próprio modelo personalizado. Como última etapa da criação de uma tarefa de rotulagem, você seleciona uma das três opções de força de trabalho humana: (1) uma força de trabalho colaborativa pública, (2) um conjunto selecionado de provedores de serviços de rotulagem de dados e (3) use seus próprios funcionários. Além disso, há a opção de habilitar a rotulagem de dados automatizada.

P: Como meus conjuntos de dados de treinamento são gerenciados usando o Amazon SageMaker Ground Truth?

R: O Amazon SageMaker Ground Truth gerencia os metadados, os rótulos associados e uma taxonomia de seus rótulos e conjuntos de dados. É possível usar facilmente o AWS SDK por meio de um bloco de anotações do SageMaker ou do console do Ground Truth no console do SageMaker para consultar e gerenciar conjuntos de dados e rótulos. Acesse a documentação do Amazon SageMaker Ground Truth para obter mais informações.

P: Como o Amazon SageMaker Ground Truth ajuda a aumentar a precisão dos conjuntos de dados de treinamento?

R: O Amazon SageMaker Ground Truth oferece os seguintes recursos para ajudar os clientes a aumentar a precisão da rotulagem de dados realizada por pessoas:

(a) Consolidação de anotações:isso neutraliza erros/preferências de operadores individuais enviando cada objeto de dados a vários funcionários e, em seguida, consolidando as respostas deles (chamadas de “anotações”) em um único rótulo. Em seguida, ele pega essas anotações e compara-as usando um algoritmo de consolidação de anotações. Esse algoritmo primeiro detecta anotações discrepantes que são desconsideradas. Em seguida, realiza uma consolidação ponderada das anotações, atribuindo pesos mais altos a anotações mais confiáveis. A saída é um rótulo único para cada objeto.

(b) Melhores práticas da interface de anotações: são os recursos das interfaces de anotações que permitem que os operadores realizem as tarefas com mais precisão. Operadores humanos são propensos a erros e preferências, e interfaces bem projetadas melhoram a precisão do operador. Uma melhor prática é exibir breves instruções juntamente com exemplos de rótulos bons e ruins em um painel lateral fixo. Outra melhor prática recomendada é escurecer a área fora do limite da caixa delimitadora quando os operadores estiverem desenhando a caixa delimitadora em uma imagem.

P: Como o Amazon SageMaker Ground Truth garante a proteção e a segurança dos meus dados?

R: Por padrão, o Amazon SageMaker Ground Truth criptografa seus dados em repouso e em trânsito. Além disso, o acesso a seus dados pode ser controlado usando o AWS Identity and Access Management (IAM). O Ground Truth não armazena nem faz cópias de seus dados fora de seu ambiente da AWS, e os dados permanecem sob seu controle. Além disso, o Ground Truth oferece suporte a padrões de conformidade, como o Regulamento geral de proteção de dados (GDPR), e fornece recursos abrangentes de registro em log e auditoria usando o Amazon CloudWatch e o Amazon CloudTrail. Acesse a documentação do Amazon SageMaker Ground Truth para obter mais informações.

P: Como faço para acessar uma força de trabalho humana usando o Amazon SageMaker Ground Truth?

R: Por meio do SageMaker Ground Truth, é possível escolher qualquer uma das três opções de força de trabalho: (1) força de trabalho colaborativa pública por meio do Amazon Mechanical Turk; (2) provedores de serviços de rotulagem de dados disponíveis no AWS Marketplace e (3) seus próprios funcionários. Acesse a documentação do Amazon SageMaker Ground Truth para obter mais informações.  

P:   O prestador de serviços de rotulagem de dados do Amazon SageMaker Ground Truth pode processar dados confidenciais?

R: Sim, os prestadores de serviços de rotulagem de dados do Amazon SageMaker Ground Truth podem processar dados confidenciais. O Contrato Padrão do Serviço entre os clientes da AWS e o terceiro prestador de serviços de rotulagem de dados contém algumas proteções básicas para suas informações confidenciais. Analise esses termos antes de compartilhar qualquer informação confidencial com o prestador de serviços. Os termos estão localizados na página de listagem do prestador de serviços no AWS Marketplace.

P: Quais padrões de segurança os prestadores de serviços de rotulagem de dados do Amazon SageMaker Ground Truth são obrigados a atender?

R: Os prestadores de serviços de rotulagem de dados são obrigados a manter a conformidade com a SOC 2 e obter a certificação anualmente. O relatório SOC 2 é uma descrição do ambiente de controle do prestador de serviços baseado nos Critérios de Serviços Confiáveis do American Institute of Certified Public Accountants (AICPA): Segurança, Disponibilidade, Integridade do processamento, Confidencialidade e Privacidade.

Além do SOC 2, os prestadores de serviços são obrigados a manter esses controles de segurança adicionais para ajudar a manter os dados do cliente seguros.

Controles tecnológicos:
Os prestadores de serviços são obrigados a utilizar o software apropriado para bloquear quaisquer tentativas de download ou cópia de arquivos/dados realizadas em seus sistemas e impedir o acesso não autorizado a esses sistemas. Os prestadores de serviços também são obrigados a proibir a força de trabalho de armazenar ou copiar dados relacionados a tarefas do cliente.

Controles de segurança da rede:
Exigimos que a rede do prestador de serviços seja projetada para evitar acesso remoto aos dados relacionados a tarefas do cliente. Além disso, softwares de compartilhamento ponto a ponto são bloqueado na rede do prestador, e o firewall deve ser projetado para proporcionar alta disponibilidade.

Controles de funcionários:
Os prestadores de serviços precisam garantir que tenham Contratos de Não Divulgação (NDAs) com seus funcionários. Os prestadores de serviços são obrigados a adotar políticas rigorosas para impedir o vazamento de qualquer informação e impedir que funcionários transmitam informações por quaisquer meios: papel, pen-drives, celulares ou qualquer outro meio.

Controle de acesso físico:
Os prestadores de serviços são obrigados a manter medidas de controle de acesso físico para impedir o acesso não autorizado ao local de produção. Podem incluir catracas com autenticação biométrica, identificação de funcionários por crachás etc.

P: Como a AWS ajuda a garantir que os prestadores de serviços cumpram essas normas de segurança?

R: A AWS solicita que os prestadores de serviços forneçam os relatórios da certificação SOC 2 antes de serem listados no Marketplace e confirma:

a autenticidade (se o auditor do prestador de serviços é certificado pela AICPA);

o período do relatório (data de validade da certificação SOC 2); e

o local de produção (o local físico em que a mão de obra do prestador de serviços trabalhará nas tarefas de rotulagem do Amazon SageMaker Ground Truth).

P: Qual a frequência da análise das normas de segurança do prestador de serviços?

R:  Os padrões de segurança de todos os provedores de serviços são revisados anualmente para garantir que cumprem os requisitos obrigatórios.

P:   Há alguma exceção na análise da AWS?

R: Não. Se o prestador de serviços deixar de cumprir normas de segurança, seu anúncio será removido do AWS Marketplace. A remoção do anúncio será concluída em 24 horas e todos os clientes ativos serão notificados por e-mail.

P:   Se o prestador de serviços oferecer serviços de rotulagem de dados por meio de vários locais de produção, todos os locais precisam passar pelo processo de análise?

R: Sim, todos os locais precisam atender às normas de segurança exigidas.

P: O que acontece se houver uma violação de dados no local de produção do prestador de serviços?

R: O prestador de serviços informará a AWS e os clientes afetados dentro de 24 horas após a detecção de qualquer confirmação ou suspeita de acesso, coleta, aquisição, uso, transmissão e divulgação não autorizados, bem como de corrupção ou perda de informações do cliente. O prestador de serviços remediará prontamente cada incidente de segurança e fornecerá à AWS e aos clientes afetados detalhes por escrito sobre a investigação interna.

Uso de provedores de serviços de rotulagem de dados

P:   O prestador de serviços de rotulagem de dados do Amazon SageMaker Ground Truth pode processar dados confidenciais?

R: Sim, os prestadores de serviços de rotulagem de dados do Amazon SageMaker Ground Truth podem processar dados confidenciais. O Contrato Padrão do Serviço entre os clientes da AWS e o terceiro prestador de serviços de rotulagem de dados contém algumas proteções básicas para suas informações confidenciais. Analise esses termos antes de compartilhar qualquer informação confidencial com o prestador de serviços. Os termos estão localizados na página de listagem do prestador de serviços no AWS Marketplace.

P: Quais padrões de segurança os prestadores de serviços de rotulagem de dados do Amazon SageMaker Ground Truth são obrigados a atender?

R: Os prestadores de serviços de rotulagem de dados são obrigados a manter a conformidade com a SOC 2 e obter a certificação anualmente. O relatório SOC 2 é uma descrição do ambiente de controle do prestador de serviços baseado nos Critérios de Serviços Confiáveis do American Institute of Certified Public Accountants (AICPA): Segurança, Disponibilidade, Integridade do processamento, Confidencialidade e Privacidade.

Além do SOC 2, os prestadores de serviços são obrigados a manter esses controles de segurança adicionais para ajudar a manter os dados do cliente seguros.

Controles tecnológicos:
Os prestadores de serviços são obrigados a utilizar o software apropriado para bloquear quaisquer tentativas de download ou cópia de arquivos/dados realizadas no sistema deles e impedir o acesso não autorizado aos demais sistemas. Os prestadores de serviços também são obrigados a proibir sua mão de obra de armazenar ou copiar dados relacionados a tarefas do cliente.

Controles de segurança da da rede:
Exigimos que a rede do prestador de serviços seja projetada para evitar acesso remoto aos dados relacionados a tarefas do cliente. Além disso, o software de compartilhamento ponto a ponto é bloqueado na rede do prestador, e o firewall deve ser projetado para proporcionar alta disponibilidade.

Controles de funcionários:
Os prestadores de serviços precisam garantir que tenham Contratos de Não Divulgação (NDAs) com seus funcionários. Os prestadores de serviços são obrigados a adotar políticas rigorosas para impedir o vazamento de qualquer informação e impedir que funcionários transmitam informações por quaisquer meios: papel, pen-drives, celulares ou qualquer outro meio.

Controle de acesso físico:
Os prestadores de serviços são obrigados a manter medidas de controle de acesso físico para impedir o acesso não autorizado ao local de produção. Podem incluir catracas com autenticação biométrica, identificação de funcionários por crachás etc.

P: Como a AWS ajuda a garantir que os prestadores de serviços cumpram essas normas de segurança?

R: A AWS solicita que os prestadores de serviços forneçam os relatórios da certificação SOC 2 antes de serem listados no Marketplace e confirma:

a autenticidade (se o auditor do prestador de serviços é certificado pela AICPA);

o período do relatório (data de validade da certificação SOC 2); e

o local de produção (o local físico em que a mão de obra do prestador de serviços trabalhará nas tarefas de rotulagem do Amazon SageMaker Ground Truth).

P: Qual a frequência da análise das normas de segurança do prestador de serviços?

R: Os prestadores de serviços são analisados anualmente para determinar se continuam a atender às normas de segurança.

P: Há alguma exceção na análise da AWS?

R: Não. Se o prestador de serviços deixar de cumprir normas de segurança, seu anúncio será removido do AWS Marketplace. A remoção do anúncio será concluída em 24 horas e todos os clientes ativos serão notificados por e-mail.

P:   Se o prestador de serviços oferecer serviços de rotulagem de dados por meio de vários locais de produção, todos os locais precisam passar pelo processo de análise?

R: Sim, todos os locais precisam atender às normas de segurança exigidas.

P: O que acontece se houver uma violação de dados no local de produção do prestador de serviços?

R: O prestador de serviços informará a AWS e os clientes afetados dentro de 24 horas após a detecção de qualquer confirmação ou suspeita de acesso não autorizado, coleta, aquisição, uso, transmissão, divulgação, corrupção ou perda de informações do cliente. O prestador de serviços remediará prontamente cada incidente de segurança e fornecerá à AWS e aos clientes afetados detalhes por escrito sobre a investigação interna.

Definição de preço e disponibilidade

P: Quanto custa o Amazon SageMaker Ground Truth?

R: Consulte a página de definição de preço do SageMaker Ground Truth para obter as informações atuais sobre definição de preço.

P: Em quais regiões da AWS o Amazon SageMaker Ground Truth está disponível?

R: A Tabela de regiões da AWS lista todas as regiões da AWS em que o Amazon SageMaker Ground Truth está disponível no momento.

Product-Page_Standard-Icons_01_Product-Features_SqInk
Saiba mais sobre a definição de preço do Amazon SageMaker Ground Truth

Comece a usar o Amazon SageMaker Ground Truth sem compromissos iniciais ou contratos de longo prazo. Para obter mais detalhes, confira a página Definição de preço para o Amazon SageMaker Ground Truth.

Product-Page_Standard-Icons_02_Sign-Up_SqInk
Cadastre-se para obter uma conta gratuita

Obtenha acesso instantâneo ao nível gratuito da AWS. 

Cadastre-se 
Product-Page_Standard-Icons_03_Start-Building_SqInk
Comece a criar no console

Comece a criar com o Amazon SageMaker Ground Truth no Console de Gerenciamento da AWS.

Faça login