Geral

P: O que é Amazon Rekognition?

O Amazon Rekognition é um serviço que facilita a adição de análises visuais avançadas aos aplicativos. O Rekognition para imagem permite criar facilmente aplicativos avançados para pesquisar, verificar e organizar milhões de imagens. O Rekognition Video permite extrair o contexto baseado em movimento de vídeos armazenados ou de streamings ao vivo e ajuda a analisá-los.

O Rekognition para imagem é um serviço de reconhecimento de imagem que detecta objetos, cenas e faces, extrai texto, reconhece celebridades e identifica conteúdo impróprio em imagens. Ele permite pesquisar e comparar faces. O Rekognition para imagem é baseado na mesma tecnologia comprovada e altamente escalável de aprendizado profundo desenvolvida pelos cientistas de visão computadorizada da Amazon para analisar diariamente bilhões de imagens para o Prime Photos.

O Rekognition para imagem usa modelos de redes neurais profundas para detectar e rotular milhares de objetos e cenas em imagens. Estamos adicionando constantemente novos rótulos e recursos de reconhecimento facial ao serviço. Com o Rekognition para imagem, você paga apenas pelas imagens analisadas e pelos metadados de faces armazenados.

O Rekognition Video é um serviço de reconhecimento de vídeo que rastreia pessoas, detecta atividades e reconhece objetos, celebridades e conteúdo impróprio em vídeos armazenados no Amazon S3 e em streamings de vídeo ao vivo do Acuity. O Rekognition Video detecta pessoas e as rastreia no vídeo, mesmo quando suas fases não são visíveis ou conforme a pessoa entra e saia da cena. Isso torna a investigação e o monitoramento em tempo real de indivíduos, como suspeitos, fáceis e precisos. Por exemplo, isso poderia ser usado em um aplicativo que envia uma notificação em tempo real quando alguém entrega um pacote na sua porta. O Rekognition Video permite também indexar metadados, como objetos, atividades, cenas, celebridades e faces, que facilitam a pesquisa de vídeos.

P: O que é deep learning?

Deep learning é um subcampo de Machine Learning e um ramo importante da inteligência artificial. O objetivo é fazer inferências de abstrações de alto nível com base em dados brutos usando um gráfico profundo com diversas layers de processamento compostas de múltiplas transformações lineares e não lineares. O deep learning é vagamente baseado em modelos cerebrais de processamento de informações e comunicações. O deep learning substitui os recursos manuais por outros aprendidos com grandes quantidades de dados anotados. O aprendizado ocorre ao estimar iterativamente centenas de milhares de parâmetros no gráfico profundo com algoritmos eficientes.

Várias arquiteturas de deep learning, como redes neurais convolucionais profundas e redes neurais recorrentes foram aplicadas a visão computacional, reconhecimento de fala, processamento de linguagem natural e reconhecimento de áudio para produzir resultados de ponta em várias tarefas.

O Amazon Rekognition faz parte da família de serviços de inteligência artificial da Amazon (Amazon AI). Os serviços do Amazon AI usam deep learning para entender imagens, transformar texto em fala natural e construir interfaces intuitivas de texto e fala em conversas.

P: Preciso de experiência em deep learning para usar o Amazon Rekognition?

Não. Com o Amazon Rekognition, você não precisa construir manter nem atualizar pipelines de deep learning.

Para obter resultados precisos em tarefas complexas de visão computacional, como detecção de objetos e cenas, análise facial e reconhecimento facial, os sistemas de deep learning precisam estar devidamente ajustados e treinados com quantidades maciças de dados reais devidamente marcados. Obter, limpar e rotular dados com precisão é uma tarefa demorada e cara. Além disso, treinar uma rede neural profunda é caro em termos computacionais e muitas vezes exige hardware personalizado construído com GPUs (unidades de processamento gráfico).

O Amazon Rekognition é totalmente gerenciado e vem pré-treinado para tarefas de reconhecimento de imagem e vídeo, de forma que você não precise investir seu tempo e seus recursos na criação de um pipeline de deep learning. O Amazon Rekognition continua a melhorar a precisão de seus modelos ao se basear nas pesquisas mais recentes e obter novos dados de treinamento. Isso lhe permite se concentrar em projeto e desenvolvimento de aplicações de alto valor.

P: Quais são os casos de uso mais comuns do Amazon Rekognition?

Os casos de uso mais comuns do Rekognition para imagem incluem:

  • Biblioteca de imagens pesquisáveis
  • Verificação de usuários com base em faces
  • Análise de sentimentos
  • Reconhecimento facial
  • Image Moderation
  • Reconhecimento de placas

Os casos de uso mais comuns do Rekognition Video incluem:

  • Resposta imediata por razões de segurança pública
  • Análise investigativa de eventos para segurança pública
  • Índice de pesquisa para arquivos de vídeo
  • Filtragem fácil de vídeo para conteúdo explícito e sugestivo

P: Como faço para começar a usar o Amazon Rekognition?  

Se você ainda não tiver se cadastrado no Amazon Rekognition, pode clicar no botão "Experimentar o Amazon Rekognition", na página do Amazon Rekognition, e concluir o processo de inscrição. Você precisa ter uma conta no Amazon Web Services; se ainda não tiver, verá um aviso para criar uma durante o processo de cadastro. Depois de se cadastrar, experimente o Amazon Rekognition com suas próprias imagens e vídeos usando o Console de Gerenciamento do Amazon Rekognition ou baixe os SDKs do Amazon Rekognition para começar a criar seus próprios aplicativos. Consulte nosso Guia de conceitos básicos, onde está o passo a passo para obter mais informações.

P: Quais as APIs oferecidas pelo Amazon Rekognition? 

O Amazon Rekognition para imagem oferece APIs para detectar objetos e cenas, detectar e analisar faces, reconhecer celebridades, detectar conteúdo impróprio, pesquisar por faces semelhantes em uma coleção de faces e gerenciar recursos. O Rekognition para imagem também oferece APIs para comparar faces e extrair texto, e o Rekognition Video também oferece APIs para rastrear pessoas e gerenciar os streamings de vídeo ao vivo do Acuity. Para obter mais detalhes, consulte a Referência de API do Amazon Rekognition.

P: Que formatos de imagem e vídeo são compatíveis com o Amazon Rekognition? 

O Amazon Rekognition para imagem atualmente é compatível com os formatos de imagem JPEG e PNG. Você pode enviar imagens como objeto do S3 ou como array de byte. As operações do Amazon Rekognition Video podem analisar os vídeos armazenados nos buckets Amazon S3. O vídeo deve ser codificado usando o codec H.264. Os formatos de arquivo com suporte são MPEG-4 e MOV. Um codec é um software ou hardware que compacta os dados para realizar uma entrega mais rápida e descompacta os dados recebidos para a forma original. O codec H.264 é normalmente usado para gravação, compactação e distribuição de conteúdo de vídeo. Um formato de arquivo de vídeo pode conter um ou mais codecs. Se o arquivo de vídeo no formato MOV ou MPEG-4 não funcionar com o Rekognition Video, verifique se o codec usado para codificar o vídeo é H.264.

P: Quais tamanhos de arquivo posso usar com o Amazon Rekognition? 

O Amazon Rekognition para imagem aceita arquivos de imagem de até 15 MB quando passados como objeto do S3 e de até 5 MB quando enviados como array de byte de imagem. O Amazon Rekognition para vídeo aceita arquivos de até 8 GB e vídeos de até 2 horas quando passados como arquivo do S3.

P: Como a resolução da imagem afeta a qualidade dos resultados da API do Rekognition para imagem? 

O Amazon Rekognition funciona em uma ampla série de resoluções de imagem. Para obter melhores resultados, recomendamos usar resolução VGA (640x480) ou superior. Uma qualidade inferior a QVGA (320x240) pode aumentar as chances de faces, objetos ou conteúdo impróprio passarem despercebidos, embora o Amazon Rekognition aceite imagens de pelo menos 80 pixels nas duas dimensões.

P: Qual o menor tamanho possível para um objeto ser detectado e analisado pelo Amazon Rekognition para imagem? 

Via de regra, verifique se o menor objeto ou face presente na imagem tem pelo menos 5% do tamanho (em pixels) da dimensão mais curta da imagem. Por exemplo: se você estiver trabalhando com uma imagem 1600x900, a menor face ou objeto deverá ter pelo menos 45 pixels em qualquer dimensão.

P: Como a resolução do vídeo afeta a qualidade dos resultados da API do Rekognition Video? 

O sistema é treinado para reconhecer faces maiores que 32 pixels (na menor dimensão), o que é convertido em um tamanho mínimo para uma face ser reconhecida que varia de aproximadamente 1/7 da menor dimensão da tela na resolução QVGA até 1/30 na resolução HD 1080p. Por exemplo, na resolução VGA, os usuários devem esperar desempenhos piores para faces menores que 1/10 da menor dimensão da tela.

P: O que mais pode afetar a qualidade das APIs do Rekognition Video? 

Além da resolução de vídeo, a qualidade das APIs pode ser afetada por muito desfoque, pessoas em movimento rápido, condições de iluminação e poses.

P: Qual é o conteúdo de vídeo do usuário mais adequado para as APIs do Rekognition Video? 

Esta API funciona melhor com vídeos de consumidores e profissionais obtidos com o campo de visão frontal em condições normais de cores e iluminação. A API não foi testada para preto e branco, infravermelho ou condições extremas de iluminação. Os aplicativos que são sensíveis a falsos alarmes são aconselhados a descartar os resultados com pontuação de confiança abaixo de uma pontuação de confiança selecionada (específica do aplicativo).

P: Em quais regiões da AWS o Amazon Rekognition está disponível? 

O Amazon Rekognition Image está disponível atualmente nas regiões Leste dos EUA (Norte da Virgínia), Oeste dos EUA (Oregon), Leste dos EUA (Ohio), UE (Irlanda) e AWS GovCloud (EUA). O Amazon Rekognition Video está disponível nas regiões Leste dos EUA (Norte da Virgínia), Oeste dos EUA (Oregon), Leste dos EUA (Ohio) e UE (Irlanda). O streaming em tempo real do Amazon Rekognition Video está disponível apenas nas regiões Leste dos EUA (Norte da Virgínia), Oeste dos EUA (Oregon) e UE (Irlanda).

Detecção de objeto e cena

P: O que é rótulo?

Rótulo é um objeto, uma cena ou um conceito encontrados dentro de uma imagem, tomando por base seu conteúdo. Por exemplo, uma foto de pessoas em uma praia tropical pode conter rótulos como ‘Pessoa’, ‘Água’, ‘Areia’, ‘Palmeira’ e ‘Roupa de banho’ (objetos), ‘Praia’ (cena) e ‘Vida ao ar livre’ (conceito). 

P: O que é pontuação de confiança e como faço para usá-la?

A pontuação de confiança é um número entre 0 e 100 que indica a probabilidade de determinada predição estar correta. No exemplo da praia tropical, se o processo de detecção de objeto e cena apresentar uma pontuação de confiança de 9 para o rótulo 'Água' e 35 para o rótulo ‘Palmeira’, é mais provável que a imagem contenha água, mas não uma palmeira.

Aplicações muito sensíveis a erros de detecção (falso-positivos) devem descartar os resultados associados às pontuações de confiança abaixo de determinado limite. O limite ideal depende da aplicação. Em muitos casos, a melhor experiência será ao definir valores de confiança mínimos mais elevados que o valor padrão.

P: O que é detecção de objeto e cena?  

Detecção de objeto e cena é o processo de analisar uma imagem ou um vídeo para atribuir rótulos com base no conteúdo visual. O Amazon Rekognition para imagem faz isso pela API DetectLabels. Essa API permite identificar automaticamente milhares de objetos, cenas e conceitos, apresentando uma pontuação de confiança para cada rótulo. DetectLabels usa um limite de confiança padrão de 50. A detecção de objeto e cena é ideal para os clientes que querem organizar e fazer buscas em grandes bibliotecas de imagem, inclusive em aplicações voltadas para consumidor e estilo de vida que dependem de conteúdo gerado pelo usuário e empresas de publicidade digital que procuram melhorar os algoritmos de direcionamento.

P: Que tipos de rótulos são compatíveis com o Amazon Rekognition?

O Rekognition é compatível com milhares de rótulos pertencentes a categorias como:

  • Pessoas e eventos: ‘Casamento’, ‘Noiva’, ‘Bebê’, ‘Bolo de aniversário’, ‘Guitarrista’, etc.
  • Alimentos e bebidas: ‘Maçã’, ‘Sanduíche’, ‘Vinho’, ‘Bolo’, ‘Pizza’, etc.
  • Natureza e vida ao ar livre: ‘Praia’, ‘Montanhas’, ‘Lago’, ‘Pôr do sol’, ‘Arco-íris’, etc.
  • Animais e bichinhos de estimação: ‘Cachorro’, ‘Gato’, ‘Cavalo’, ‘Tigre’, ‘Tartaruga’, etc.
  • Casa e jardim: ‘Cama’, ‘Mesa’, ‘Quintal’, ‘Candelabro’, ‘Quarto’, etc.
  • Esportes e lazer: ‘Golfe’, ‘Basquete’, ‘Hóquei’, ‘Tênis’, ‘Hiking’, etc.
  • Plantas e flores: ‘Rosa’, ‘Tulipa’, ‘Palmeira’, ‘Floresta’, ‘Bambu’, etc.
  • Arte e entretenimento: ‘Escultura’, ‘Pintura’, ‘Guitarra’, ‘Balé’, ‘Mosaico’, etc.
  • Transporte e veículos: ‘Avião’, ‘Carro’, ‘Bicicleta’, ‘Motocicleta’, ‘Caminhão’, etc.
  • Eletrônico: ‘Computador’, ‘Celular’, ‘Câmera de vídeo’, ‘TV’, ‘Fones de ouvido’, etc.

P: Como a detecção de objeto e cena é diferente na análise de vídeo?

O Rekognition Video permite identificar automaticamente milhares de objetos, como veículos ou animais de estimação, e atividades, como celebrações ou danças, e fornece timestamps e uma pontuação de confiança para cada rótulo. Também depende do contexto de movimento e tempo no vídeo para identificar com precisão atividades complexas, como "soprar uma vela" ou "apagar fogo".

P: Não consigo encontrar o rótulo de que preciso. Como faço para requisitar um novo rótulo?

Envie suas solicitações pelo atendimento ao cliente da AWS. O Amazon Rekognition expande continuamente seu catálogo de rótulos com base no feedback dos clientes.

Unsafe Content Detection

P: O que é Unsafe Content Detection?

A Unsafe Content Detection do Amazon Rekognition é uma API baseada em deep learning fácil de usar para a detecção de conteúdo adulto explícito ou sugestivo em imagens. Os desenvolvedores podem usar este metadado adicional para filtrar conteúdo impróprio com base nas suas necessidades empresariais. Além de sinalizar uma imagem com base na presença de conteúdo adulto, a Image Moderation também retorna uma lista hierárquica de rótulos com pontuações de confiança. Esses rótulos indicam categorias específicas de conteúdo adulto, o que disponibiliza um maior controle granular para que os desenvolvedores possam filtrar e gerenciar grandes volumes de UGC (User generated content – Conteúdo gerado pelo usuário). Esta API pode ser usada em fluxos de trabalho de moderação para aplicações, como sites de relacionamentos e redes sociais, plataformas de compartilhamento de fotos, blogs e fóruns, aplicações para crianças, websites de comércio eletrônico, entretenimento e serviços de anúncios online.

P: Quais tipos de conteúdo adulto explícito e sugestivo o Amazon Rekognition detecta?

O Amazon Rekognition detecta os seguintes tipos de conteúdo adulto explícito e sugestivo em imagens:

  • Nudez explícita
  • Nudez
  • Nudez masculina gráfica
  • Nudez feminina gráfica
  • Atividade sexual
  • Nudez parcial
  • Sugestivo
  • Mulheres usando trajes de banho ou roupas íntimas
  • Homens usando trajes de banho ou roupas íntimas
  • Roupas ousadas

A API Unsafe Image Detection do Amazon Rekognition retorna uma hierarquia de rótulos e também uma pontuação de confiança para cada rótulo detectado. Por exemplo, ao obter uma imagem imprópria, o Rekognition poderá retornar a classificação de "Nudez explícita" com uma pontuação de confiança como um rótulo de nível superior. Os desenvolvedores poderão usar isso para sinalizar o conteúdo. Na mesma resposta, o Rekognition também retornará um segundo nível de granularidade ao disponibilizar contexto adicional, como a classificação de "Nudez masculina gráfica" com sua própria pontuação de confiança. Os desenvolvedores poderão usar estas informações para criar uma lógica de filtragem mais complexa.

Observe que a API Unsafe Image Detection não é uma autoridade no que se refere a, e sob nenhuma circunstância afima ser um filtro exaustivo de, conteúdo adulto explícito ou sugestivo. Além disso, essa API não detecta se uma imagem inclui conteúdo ilegal (como pornografia infantil) ou conteúdo adulto anormal.

P: A API Unsafe Image Detection do Amazon Rekognition pode detectar outro conteúdo impróprio, além de conteúdo adulto explícito e sugestivo?

No momento, o Rekognition só aceita os rótulos que descrevemos acima. Trabalharemos continuamente para adicionar e melhorar os rótulos com base no feedback dos nossos clientes.
Se você precisar que outros tipos de conteúdo impróprio sejam detectados em imagens, entre em contato conosco usando o processo de feedback descrito mais adiante nesta seção.

P: Como a Unsafe Content Detection é diferente para a análise de vídeo?

O Rekognition Video permite identificar automaticamente o conteúdo adulto explícito ou sugestivo e também oferece timestamps e uma pontuação de confiança para cada etiqueta de tipo de conteúdo.

P: Como posso garantir que o Rekognition atenderá ao meu caso de uso de detecção de imagem e vídeo?

Os modelos de Unsafe Content Detection do Rekognition foram ajustados e testados extensivamente, mas recomendamos que você calcule a exatidão do serviço nos seus próprios dados para regular o desempenho.

Você pode usar o parâmetro "MinConfidence" nas solicitações de API para equilibrar a detecção do conteúdo (lembrar) em contraponto com a exatidão da detecção (precisão). Se você reduzir o parâmetro "MinConfidence", provavelmente detectará a maior parte do conteúdo impróprio, mas também possivelmente sinalizará conteúdo que não seja nem explícito nem sugestivo. Caso aumente o parâmetro "MinConfidence", você provavelmente garantirá que todo o conteúdo detectado seja de fato explícito ou sugestivo, mas possivelmente algum conteúdo impróprio não será sinalizado. Consulte a documentação aqui para obter exemplos sobre como usar o parâmetro "MinConfidence" para imagens.

No caso de o Rekognition falhar na detecção de conteúdo adulto em imagens ou vídeos, entre em contato conosco usando o processo de feedback descrito abaixo.

P: Como posso enviar feedback ao Rekognition para melhorar a Unsafe Content Detection? 

Envie suas solicitações pelo atendimento ao cliente da AWS. O Amazon Rekognition expande continuamente os tipos de conteúdo impróprio detectados com base no feedback do cliente. Geralmente, o tempo necessário para adicionar novos tipos de conteúdo adulto explícito ou sugestivo varia entre 6 e 8 semanas. Observe que conteúdo ilegal (como pornografia infantil) não será aceito durante este processo.

Análise facial

P: O que é análise facial?

Análise facial é o processo de detecção de uma face dentro de uma imagem e de extração dos atributos relevantes dela. O Amazon Rekognition para imagem retorna a caixa delimitadora para cada face detectada em uma imagem, juntamente com atributos como gênero, presença de óculos de sol e pontos de referência. O Rekognition Video retornará as faces detectadas em um vídeo com timestamps e, para cada face detectada, a posição e uma caixa delimitadora, juntamente com os pontos de referência da face.

P: Quais atributos faciais posso obter com o Amazon Rekognition?

O Amazon Rekognition apresenta os atributos faciais a seguir para cada face detectada, junto com uma caixa limitadora e uma pontuação de confiança para cada atributo:

  • Sexo
  • Sorriso
  • Emoções
  • Óculos
  • Óculos escuros
  • Olhos abertos
  • Boca aberta
  • Bigode
  • Barba
  • Pose
  • Qualidade
  • Pontos de referência faciais

P. O que é pose facial?

Pose facial refere-se à rotação de uma face detectada nos eixos lateral, vertical e longitudinal. Cada um desses parâmetros é apresentado como ângulo entre -180 e +180 graus. A pose facial pode ser usada para encontrar a orientação do polígono limitador da face (ao contrário de uma caixa limitadora retangular) para medir deformação, rastrear faces com precisão e muito mais.

P: O que é qualidade da face?

Qualidade da face descreve a qualidade da imagem de face detectada usando dois parâmetros: nitidez e brilho. Os dois parâmetros são apresentados como valores entre 0 e 1. Você pode aplicar um limite a esses parâmetros para filtrar faces bem iluminadas e nítidas. Isso é útil para aplicações que se beneficiam de imagens faciais de alta qualidade, como comparação facial e reconhecimento facial.

P: O que são pontos de referência facial?  

Pontos de referência facial são um conjunto de pontos salientes no geral localizados em cantos, pontas ou pontos médios dos principais componentes faciais, como olhos, nariz e boca. A API DetectFaces do Amazon Rekognition apresenta uma série de pontos de referência faciais que podem ser usados para cortar faces, transformar uma face em outra, sobrepor máscaras personalizadas para criar filtros personalizados e muito mais.

P: Quantas faces posso detectar em uma imagem?

Você pode detectar até 100 faces em uma imagem usando o Amazon Rekognition.

P: Como a análise facial é diferente para a análise de vídeo?

Com o Rekognition Video, é possível localizar faces dentro de vídeos e analisar atributos faciais, como se a face está sorrindo, os olhos estão abertos ou está expressando alguma emoção. O Rekognition Video retornará as faces detectadas em um vídeo com timestamps e, para cada face detectada, a posição e uma caixa delimitadora, juntamente com os pontos de referência, como olho esquerdo, olho direito, nariz e os cantos esquerdo e direito da boca. Essas informações de posição e tempo podem ser usadas para rastrear facilmente o sentimento do usuário ao longo do tempo e oferecer funcionalidades adicionais, como quadros de rosto automáticos, destaques ou recortes.

P: Além da resolução de vídeo, o que mais pode afetar a qualidade das APIs do Rekognition Video?

Além da resolução de vídeo, a qualidade e as faces representativas, parte das coleções de face a serem pesquisadas, têm grande impacto. O uso de múltiplas instâncias faciais por pessoa com variações, como barba, óculos, poses (perfil e frontal), melhorará significativamente o desempenho. Geralmente as pessoas em movimento muito rápido e vídeos borrados podem apresentar menor qualidade.

Comparação de faces

P: O que é comparação de faces?

Comparação de faces é o processo de comparar uma face com uma ou mais faces para medir a semelhança. Usando a API CompareFaces, o Amazon Rekognition para imagem permite medir a probabilidade de as faces em duas imagens serem da mesma pessoa. A API compara uma face na imagem de origem a cada face detectada na imagem de destino e apresenta uma pontuação de semelhança para cada comparação. São também apresentadas uma caixa limitadora e uma pontuação de confiança para cada face detectada. É possível usar a comparação facial para verificar a identidade da pessoa com relação à foto pessoal em arquivo quase em tempo real.

P: Posso usar uma imagem de origem com mais de uma face? 

Sim. Se a imagem contiver várias faces, o CompareFaces detectará a maior e a usará para compará-la a cada face detectada na imagem de destino.

P: Com quantas faces posso fazer a comparação?

Você pode comparar uma face na imagem de origem com até 15 faces detectadas na imagem de destino.

Reconhecimento facial

P: O que é reconhecimento facial?

Reconhecimento facial é o processo de identificar ou verificar a identidade de uma pessoa ao buscar sua face em uma coleção de faces. Usando o reconhecimento facial, fica fácil criar aplicativos de autenticação multifator para pagamentos bancários, entrada automatizada no edifício para funcionários e muito mais.

P: O que é coleção de faces e como faço para criar uma?

A coleção de faces é um índice pesquisável de vetores de características faciais. A propriedade e o gerenciamento desse índice são seus. Usando a API CreateCollection, é possível criar facilmente uma coleção em uma região suportada da AWS e retornar como Nome de recurso da Amazon (ARN). Cada coleção de faces tem uma CollectionId exclusiva associada.

P: Como faço para adicionar ou excluir faces de uma coleção?  

Para adicionar uma face a uma coleção existente, use a API IndexFaces. Essa API aceita uma imagem na forma de objeto do S3 ou array de byte de imagem e adiciona uma representação vetorial das faces detectadas para a coleção de faces. A IndexFaces também apresenta uma FaceId exclusiva e uma caixa limitadora facial para cada uma das faces adicionadas.

Para excluir uma face de uma coleção de faces existente, use a API DeleteFaces. Essa API funciona com a coleção de faces fornecida (usando uma CollectionId) e remove as entradas correspondentes à lista de FaceIds. Para obter mais informações sobre como adicionar ou excluir faces, consulte o exemplo Gerenciamento de coleções.

P. Como faço para buscar uma face dentro de uma coleção de faces?  

Depois de criar uma coleção de faces indexada, é possível buscar uma face dentro dela usando ou uma imagem (SearchFaceByImage) ou um FaceId (SearchFaces). Essas APIs pegam uma face inserida e apresentam um conjunto de faces correspondentes, ordenadas por pontuação de semelhança, com a maior semelhança primeiro. Para obter mais detalhes, consulte nosso exemplo Buscando faces.

P: Como o reconhecimento facial é diferente para a análise de vídeo?

O Rekognition Video permite realizar pesquisas de face em tempo real com base nas coleções com dezenas de milhões de faces. Primeiro, crie um conjunto de rostos, onde será possível armazenar rostos, que são representações vetoriais de traços faciais. Em seguida, o Rekognition pesquisa a coleção de faces para encontrar faces visualmente semelhantes em todo o seu vídeo. O Rekognition retornará uma pontuação de confiança para cada uma das faces em seu vídeo, para que sejam exibidas as correspondências possíveis no aplicativo. Em aplicativos de segurança e vigilância, isso ajuda a identificar suspeitos em tempo real, com base em uma coleção de milhões de faces, permitindo uma prevenção de crime oportuna e precisa.

P: Além da resolução de vídeo, o que mais pode afetar a qualidade das APIs de vídeo?

Além da resolução de vídeo, a qualidade e as faces representativas, parte das coleções de face a serem pesquisadas, têm grande impacto. O uso de múltiplas instâncias faciais por pessoa com variações, como barba, óculos, poses (perfil e frontal), melhorará significativamente o desempenho. Geralmente as pessoas com movimentos muito rápidos podem resultar em uma baixa revocação. Além disso, os vídeos borrados podem apresentar qualidade inferior.

Celebrity Recognition

P: O que é o Celebrity Recognition?

O recurso Celebrity Recognition do Amazon Rekognition é uma API fácil de usar, baseada em aprendizado profundo, para a detecção e o reconhecimento de indivíduos famosos, relevantes ou proeminentes em seus campos de atuação. A API RecognizeCelebrities foi criada para operar em grande escala e reconhecer celebridades de várias categorias, como política, esportes, negócios, entretenimento e mídia. Nosso recurso Celebrity Recognition é ideal para clientes que precisam indexar e pesquisar por celebridades em suas bibliotecas de imagens com base em seus interesses específicos.

P: Quem pode ser identificado pela API do Celebrity Recognition?

O Amazon Rekognition só pode identificar celebridades que os modelos de aprendizado profundo tiverem sido treinados para reconhecer. Observe que a API RecognizeCelebrities não é (tampouco alega ser) uma profunda conhecedora de uma imensa lista de celebridades. O recurso foi criado para incluir o máximo de celebridades possível, com base nas necessidades e no feedback dos nossos clientes. Estamos constantemente adicionando novos nomes, mas o fato de o Celebrity Recognition não reconhecer indivíduos que possam ser considerados proeminentes por qualquer outro grupo ou pelos nossos clientes não é um reflexo da nossa opinião a respeito do status de celebridade mantido por essas pessoas. Se você quiser ver outras celebridades identificadas pelo Celebrity Recognition, envie o seu feedback para a gente.

P: Uma celebridade identificada por meio da API do Amazon Rekognition pode solicitar sua remoção do recurso?

Sim. Se uma celebridade desejar ser removida do recurso, ela poderá enviar um e-mail para o Atendimento ao cliente da AWS e nós processaremos a solicitação de remoção.

P: Quais recursos são aceitos para disponibilizar informações adicionais sobre uma celebridade?

A API aceita uma lista opcional de fontes para a disponibilização de informações adicionais sobre a celebridade como parte da resposta da API. No momento, disponibilizamos o URL do IMDB, quando há um disponível para a celebridade em questão. Existe a possibilidade de adicionarmos outras fontes posteriormente.

P: Como a Celebrity Recognition é diferente para a análise de vídeo?

Com o Rekognition Video, você pode detectar e reconhecer quando e onde pessoas conhecidas aparecem em um vídeo. O resultado codificado por tempo inclui o nome e o ID exclusivo da celebridade, as coordenadas da caixa delimitadora, a pontuação de confiança e os URLs que indicam o conteúdo relacionado a ela, como seu link do IMDB. A celebridade também é detectada mesmo quando o rosto pode estar oculto no vídeo. Esse recurso permite indexar e pesquisar em bibliotecas de vídeos digitais para os casos de uso relacionados às suas necessidades específicas de marketing e mídia.

P: Além da resolução de vídeo, o que mais pode afetar a qualidade das APIs do Rekognition Video? 

Celebridades em movimentos muito rápidos e vídeos borrados podem afetar a qualidade das APIs do Rekognition Video. Além disso, a qualidade pode ser afetada por maquiagem pesada e camuflagem, comuns para atores/atrizes.

Text in Image

P: O que é o Text in Image? 

O Text in Image é um recurso do Amazon Rekognition que permite detectar e reconhecer texto em uma imagem, como nomes de ruas, legendas, nomes de produtos e placas de licenciamento de veículos. O recurso Text in Image foi criado especificamente para processar imagens do mundo real, em vez de imagens de documentos. A API DetectText do Amazon Rekognition processa uma imagem e retorna o rótulo de texto e uma caixa delimitadora para cada string de caracteres detectada, juntamente com uma pontuação de confiabilidade. Por exemplo, em aplicativos de compartilhamento de imagens e mídia social, é possível habilitar uma pesquisa visual baseada em um índice de imagens que contêm os mesmos rótulos de texto. Em aplicativos de mídia e entretenimento, você pode criar metadados de texto para quadros de vídeo a fim de oferecer suporte a pesquisas por conteúdo relevante, como notícias, resultados esportivos, comerciais e legendas. Em aplicativos de segurança e vigilância, é possível identificar veículos com base nos números de placa de licenciamento de imagens capturadas por câmeras corporais ou de trânsito.

P: Para quais os tipos de texto o Text in Image do Amazon Rekognition oferece suporte? 

O recurso Text in Image foi criado especificamente para processar imagens do mundo real, em vez de imagens de documentos. Esse recurso oferece suporte à maioria dos caracteres e números latinos incorporados em uma grande variedade de layouts, fontes e estilos, e sobrepostos em objetos no plano de fundo em diversas orientações como faixas e cartazes. O Text in Image reconhece até 50 sequências de caracteres por imagem e as lista como palavras e linhas. Além disso, o Text in Image reconhece apenas texto horizontal com orientação entre -30 e +30 graus.

P: Como posso enviar feedback ao Rekognition para melhorar o reconhecimento de texto?

Envie suas solicitações pelo atendimento ao cliente da AWS. O Amazon Rekognition amplia continuamente os tipos de conteúdo de texto detectados com base no feedback do cliente.

Análise de vídeo

P: Como funcionam as APIs assíncronas do Amazon Rekognition Video? 

O Rekognition Video processa um vídeo armazenado em um bucket Amazon S3. O padrão de design é um conjunto assíncrono de operações. Comece a análise de vídeo chamando uma operação Start, como StartLabelDetection. O status de conclusão da solicitação é publicado em um tópico do Amazon Simple Notification Service. Para obter o status de conclusão do tópico do Amazon SNS, você pode usar uma fila do Amazon Simple Queue Service ou uma função do AWS Lambda. Depois que você conhece o status de conclusão, chama uma operação Get, como GetLabelDetection, para obter os resultados da solicitação.

 

P: O que é o rastreamento de pessoas? 

Com o Rekognition Video, você pode rastrear cada pessoa em um quadro e em todos os quadros do vídeo. O Rekognition Video detecta pessoas mesmo quando a câmera está em movimento e, para cada pessoa, retorna uma caixa delimitadora e a face, juntamente com os atributos de face e os timestamps. Em aplicativos de segurança e vigilância, isso torna a investigação e o monitoramento de indivíduos fáceis e precisos. Em aplicativos de varejo, isso permite gerar insights de clientes, como o modo como os clientes se movem pelos corredores de um shopping center ou quanto tempo eles esperam nas filas de pagamento.

P: Como posso analisar os vídeos em tempo real?  

No modo de streaming, você pode procurar faces em tempo real, com base em uma coleção com dezenas de milhões de faces. As APIs de detecção de faces e de reconhecimento de faces do Rekognition Video se integram nativamente aos streamings de vídeo do Amazon Kinesis Video Streams, um serviço que permite aos desenvolvedores transmitir milhares de feeds ao vivo e os metadados associados. Em aplicativos de segurança, isso torna a identificação de suspeitos em tempo real fácil e precisa.

P: O Amazon Rekognition Video funciona com o Amazon Kinesis Video Streams? 

O Rekognition Video usa um Kinesis Video Stream como entrada para processar um streaming de vídeo. Os resultados da análise são obtidos do Rekognition Video para um streaming de dados do Kinesis e, por fim, lidos pelo seu aplicativo cliente. O Rekognition Video oferece um processador de transmissão que você pode usar para iniciar e gerenciar a análise do seu streaming de vídeo. Para saber mais, consulte Trabalhando com streaming de vídeos.

Faturamento

P: Como o Amazon Rekognition conta o número de imagens processadas?

Para APIs que aceitam imagem como entradas, o Amazon Rekognition conta o número real de imagens analisadas como sendo o número de imagens processadas. DetectLabels, DetectModerationLabels, DetectFaces, IndexFaces, RecognizeCelebrities e SearchFaceByImage se encaixam nessa categoria. Para a API CompareFaces, na qual duas imagens constituem uma entrada, somente a imagem de origem é contada como unidade das imagens processadas.

Para chamadas de API que não precisam de imagem como parâmetro de entrada, o Amazon Rekognition conta cada chamada de API como uma imagem processada. SearchFaces e ListFaces se encaixam nessa categoria.

As outras APIs de reconhecimento do Amazon Rekognition – DeleteFaces, CreateCollection, DeleteCollection e ListCollections – não entram na contagem das imagens processadas.

P: Como o Amazon Rekognition conta o número de minutos de vídeo processados?

Para os vídeos arquivados, o Amazon Rekognition conta os minutos de vídeo que são processados com sucesso pela API e os mede para faturação. Para os streamings de vídeo ao vivo, você é cobrado por partes de cinco segundos de vídeo que processamos com sucesso.

P. Por quais APIs o Amazon Rekognition cobra?

O Amazon Rekognition para imagem cobra pelas seguintes APIs: DetectLabels, DetectModerationLabels, DetectFaces, IndexFaces, RecognizeCelebrities, SearchFaceByImage, CompareFaces, SearchFaces e ListFaces. As cobranças do Amazon Rekognition Video se baseiam na duração do vídeo em minutos, processada com sucesso pelas APIs StartLabelDetection, StartFaceDetection, StartFaceDetection, SatrtContentModeration, StartPersonTracking, StartCelebrityRecognition, StartFaceSerach e StartStreamProcessor.

P. Quanto custa o Amazon Rekognition?

Veja a Página de definição de preço do Amazon Rekognition para conhecer as informações de definição de preço atuais.

P. Haverá cobrança pelos vetores de funcionalidades que eu armazenar nas minhas coleções de faces?

Sim. O Amazon Rekognition cobra USD 0,01 por 1.000 vetores de face por mês. Para obter mais detalhes, veja a página de definição de preço.

P. O Amazon Rekognition participa do nível gratuito da AWS?

Sim. Como parte do nível de uso gratuito da AWS, você pode dar os primeiros passos gratuitamente com o Amazon Rekognition. Ao se cadastrarem, novos clientes do Amazon Rekognition podem analisar até 5.000 imagens gratuitamente a cada mês, durante os primeiros 12 meses. Você pode usar todas as APIs do Amazon Rekognition com esse nível gratuito e armazenar até 1.000 faces sem cobrança alguma. Além disso, os clientes do Amazon Rekognition Video podem analisar 1.000 minutos de vídeo grátis, por mês, durante o primeiro ano.

P: Os preços incluem impostos?

Para obter detalhes fiscais, veja Ajuda com impostos do Amazon Web Services.

Integração à AWS

P: O Amazon Rekognition Video funciona com imagens armazenadas no Amazon S3?

Sim. Você pode começar a analisar as imagens armazenadas no Amazon S3 simplesmente ao apontar a API do Amazon Rekognition para o bucket do S3. Não é necessário mover seus dados. Para obter mais detalhes sobre como usar objetos do S3 com chamadas da API do Amazon Rekognition, veja nosso exercício de detecção de rótulos.

P: Posso usar o Amazon Rekognition com imagens armazenadas em um bucket Amazon S3 em outra região?

Não. Verifique se o bucket Amazon S3 que deseja usar está na mesma região que o endpoint da API do Amazon Rekognition.

P: Como faço para processar múltiplos arquivos de imagem em lote usando o Amazon Rekognition?

Você pode processar as imagens do Amazon S3 em lote usando as etapas descritas no nosso exemplo de processamento em lote do Amazon Rekognition no GitHub.

P: Como posso usar o AWS Lambda com o Amazon Rekognition?

O Amazon Rekognition fornece acesso perfeito ao AWS Lambda e lhe permite levar a análise de imagem baseada em trigger aos datastores da AWS, como Amazon S3 e Amazon DynamoDB. Para usar o Amazon Rekognition com o AWS Lambda, siga as etapas descritas aqui e selecione o blueprint do Amazon Rekognition.

Privacidade de dados

P: As entradas de imagem e vídeo processadas pelo Amazon Rekognition são armazenadas? E como elas são usadas pela AWS?

O Amazon Rekognition pode armazenar e usar entradas de imagem e vídeo processadas pelo serviço exclusivamente para oferecer e manter o serviço, e para melhorar e desenvolver a qualidade do Amazon Rekognition e de outras tecnologias de inteligência artificial/aprendizado de máquina da Amazon. O uso do seu conteúdo é necessário para uma melhoria contínua da experiência do cliente do Amazon Rekognition, incluindo o desenvolvimento e o treinamento de tecnologias relacionadas. Não usamos nenhuma informação de identificação pessoal que possa estar contida em seu conteúdo para direcionar produtos, serviços ou marketing para você ou seus usuários finais. A sua confiança e privacidade, bem como a segurança do seu conteúdo, são a nossa maior prioridade. Para isso, implementamos controles técnicos e físicos adequados e sofisticados, incluindo a criptografia de dados ociosos e em trânsito, projetados para evitar acesso ou divulgação de conteúdo sem a sua autorização e garantir que o nosso uso seja compatível com os compromissos que assumimos com você. Acesse https://aws.amazon.com/compliance/data-privacy-faq/ para obter mais informações.

P: Posso excluir as entradas de imagem e vídeo armazenadas pelo Amazon Rekognition?

Sim. É possível solicitar a exclusão de entradas de imagem e de vídeo associadas à sua conta; basta entrar em contato com o AWS Support. A exclusão de entradas de imagem e vídeo pode degradar sua experiência com o Amazon Rekognition.

P: Quem tem acesso ao meu conteúdo processado e armazenado pelo Amazon Rekognition?

Somente funcionários autorizados terão acesso ao seu conteúdo que é processado pelo Amazon Rekognition. Ter a sua confiança e oferecer a você privacidade e segurança são nossas maiores prioridades. Para isso, implementamos controles técnicos e físicos que são adequados e avançados, incluindo criptografia em repouso e em trânsito, para impedir acesso não autorizado ao seu conteúdo, bem como a sua divulgação, e garantir que o nosso uso esteja de acordo com os compromissos que firmamos com você. Acesse https://aws.amazon.com/compliance/data-privacy-faq/ para obter mais informações.

P: Meu conteúdo processado e armazenado pelo Amazon Rekognition ainda é de minha propriedade?

Você sempre mantém a propriedade de seu conteúdo e usaremos seu conteúdo apenas com o seu consentimento.

P: O conteúdo processado pelo Amazon Rekognition é movido para fora da região da AWS na qual estou usando o Amazon Rekognition?

Todo o conteúdo processado pelo Amazon Rekognition é criptografado e armazenado em repouso na região da AWS na qual você está usando o Amazon Rekognition. Parte do conteúdo processado pelo Amazon Rekognition pode ser armazenado em outra região da AWS unicamente em conexão com a melhoria contínua e o desenvolvimento de sua experiência do cliente do Amazon Rekognition e outras tecnologias de inteligência artificial/aprendizado de máquina da Amazon. É possível solicitar a exclusão de entradas de imagem e de vídeo associadas à sua conta; basta entrar em contato com o AWS Support. Ter a sua confiança e oferecer a você privacidade e segurança são nossas maiores prioridades. Para isso, implementamos controles técnicos e físicos que são adequados e avançados, incluindo criptografia em repouso e em trânsito, para impedir acesso não autorizado ao seu conteúdo, bem como a sua divulgação, e garantir que o nosso uso esteja de acordo com os compromissos que firmamos com você. Acesse https://aws.amazon.com/compliance/data-privacy-faq/ para obter mais informações.

P: Posso usar o Amazon Rekognition em conexão com websites, programas ou outros aplicativos direcionados ou criados para crianças menores de 13 anos de idade e sujeitos à COPPA (Children’s online privacy protection act – Lei de proteção da privacidade online da criança)?

Sim. Sujeito à sua conformidade com os Termos de serviços do Amazon Rekognition, que incluem a sua obrigação de disponibilizar qualquer notificação exigida e obter todos os consentimentos parentais verificáveis exigidos pela COPPA, você poderá usar o Amazon Rekognition em conexão com websites, programas ou outros aplicativos direcionados ou criados, de modo integral ou parcial, para crianças menores de 13 anos.

P: Como posso determinar se o meu website, programa ou aplicativo está sujeito à COPPA?

Para obter informações sobre as exigências da COPPA e as diretrizes para determinar se o seu website, programa ou outro aplicativo está de acordo com a COPPA, consulte diretamente os recursos disponibilizados e mantidos pela United States Federal Trade Commission (Comissão da Federação Americana de Comércio). Esse website também contém informações sobre como determinar se um serviço é direcionado ou criado, de modo integral ou parcial, para crianças menores de 13 anos.

Controle de acesso

P: Como faço para controlar o acesso do usuário ao Amazon Rekognition?

O Amazon Rekognition é integrado ao AWS Identity and Access Management (IAM). As políticas do AWS IAM podem ser usadas de forma que somente os usuários autorizados tenham acesso às APIs do Amazon Rekognition. Para obter mais detalhes, veja a página Autenticação e controle de acesso ao Amazon Rekognition.

Saiba mais sobre a definição de preço do Amazon Rekognition

Acesse a página de definição de preço
Pronto para começar?
Cadastrar-se
Mais dúvidas?
Entre em contato conosco