Publicado en: Feb 17, 2020

Amazon Rekognition es un servicio de análisis de imágenes y videos basado en aprendizaje profundo capaz de identificar objetos, personas, texto, escenas y actividades, y de admitir la moderación de contenido mediante la detección de contenido no seguro. A partir de hoy, puede detectar texto en videos y obtener la puntuación de confianza, la ubicación del cuadro delimitador y la marca temporal por cada detección de texto. Además, la detección de texto en imágenes y videos ofrece ahora opciones prácticas para filtrar palabras por regiones de interés, tamaño del texto del cuadro delimitador y puntuación de confianza del texto.  

La detección de texto en video puede ser útil para múltiples casos de uso, sobre todo en aplicaciones multimedia y de entretenimiento. Primero, puede buscar videos o marcas temporales de videos en los que aparezcan palabras clave en pantalla como, por ejemplo, “noticias de última hora”. Segundo, para la internacionalización del contenido, puede buscar con rapidez instancias de texto en la línea temporal del video de un programa, para reemplazarlo con texto en otro idioma. Tercero, para casos de uso de moderación y conformidad, puede detectar la presencia de texto accidental como subtítulos incrustados o marcar texto que contenga insultos o discurso de odio al contrastar las palabras con un diccionario que contenga una lista negra de palabras y frases. Por último, puede utilizar la ubicación del cuadro delimitador para estudiar el impacto del tamaño del texto y la posición de cara al rendimiento de una campaña de marketing, o para situar otros elementos gráficos correctamente. 

El filtrado por región, tamaño y puntuación de confianza del texto le brinda una flexibilidad adicional para controlar el resultado de su detección de texto. Gracias a las regiones de interés, puede limitar la detección de texto a las regiones que considera relevantes: por ejemplo, el tercio inferior para gráficos en pantalla o la esquina superior izquierda para mostrar marcadores en un partido de fútbol. El filtro de tamaño del cuadro delimitador de texto puede utilizarse para evitar texto de fondo pequeño que sea molesto o irrelevante. Por último, el filtro de confianza del texto le permite eliminar resultados que no sean fiables, como texto borroso o difuminado. 

La detección de texto para video y el filtrado de texto están disponibles ahora en todas las regiones de AWS compatibles con Amazon Rekognition. Para comenzar, puede descargar el AWS SDK más reciente y consultar nuestra documentación para obtener más información.