Publicado: Feb 17, 2020

O Amazon Rekognition é um serviço de análise de imagens e vídeos baseado em aprendizagem profunda que pode identificar objetos, pessoas, textos e cenas, bem como permitir a moderação de conteúdo mediante a detecção de conteúdo inseguro. A partir de hoje, é possível detectar texto em vídeos e recuperar a confiança da detecção, a caixa delimitadora do local e o carimbo de data/hora de cada detecção de texto. Além disso, a detecção de texto em imagens e vídeos fornece opções convenientes para filtrar palavras por regiões de interesse (ROIs, Regions of Interest), tamanho da caixa delimitadora de palavras e pontuação de confiança de palavras.  

A detecção de texto em vídeos pode ser utilizada em vários casos de uso, principalmente em aplicativos de mídia e entretenimento. Primeiro, você pode pesquisar por vídeos ou carimbos de data/hora de vídeos em que as palavras-chave aparecem na tela, por exemplo, "Notícias de última hora". Segundo, para internacionalização de conteúdo, você pode encontrar rapidamente todas as instâncias de texto na linha de tempo de vídeo de um programa para que possam ser substituídas por texto em outro idioma. Terceiro, para casos de uso de conformidade ou moderação, é possível detectar a presença de texto acidental, como o gravado em legendas ou em texto de bandeiras contendo palavrões e discurso de ódio, comparando as palavras com um dicionário de palavras e frases proibidas. Por fim, você pode usar o local da caixa delimitadora para estudar o impacto do tamanho e do local do texto na performance de uma campanha de marketing ou posicionar outro elemento gráfico corretamente. 

A filtragem por região, tamanho e pontuação de confiança oferece flexibilidade adicional para controlar a saída de detecção de seu texto. Usando ROIs, é possível limitar facilmente a detecção de texto a regiões relevantes para você. Por exemplo, uma região no terço inferior referente a gráficos na tela ou um canto superior esquerdo para ler placares em um jogo de futebol. O filtro de tamanho da caixa delimitadora de palavras pode ser usado para evitar texto pequeno em segundo plano que pode ser ruidoso ou irrelevante. Por fim, o filtro de confiança de palavras permite remover resultados que podem não ser confiáveis por estarem borrados ou manchados. 

A detecção de texto para filtragem de vídeo e texto agora está disponível em todas as regiões da AWS compatíveis com o Amazon Rekognition. Para começar, você pode baixar o AWS SDK mais recente e consultar nossa documentação para obter mais detalhes.