Publicado en: Nov 21, 2017

Amazon Rekognition ha añadido hoy tres características nuevas: detección y reconocimiento de texto en imágenes, reconocimiento facial en tiempo real en decenas de millones de rostros, y detección de hasta 100 rostros en fotografías complejas con un gran número de personas. Los clientes que ya están utilizando Amazon Rekognition para la verificación y la identificación facial experimentarán hasta un 10% de mejora en cuanto a precisión en la mayoría de los casos. 

Texto en imágenes: los clientes que utilizan Amazon Rekognition para detectar objetos y rostros en imágenes nos han pedido que reconozcamos el texto existente en las imágenes, como nombres de calles y placas de matrícula capturadas por cámaras de tráfico, noticias y rótulos de pantallas de televisión o citas estilizadas superpuestas en fotografías familiares capturadas con teléfonos móviles. A partir hoy, puede utilizar la función Texto en imágenes de Rekognition para reconocer y extraer contenido de texto de las imágenes. Texto en imágenes se ha diseñado específicamente para trabajar con imágenes del mundo real en lugar de imágenes de documentos. Admite números y texto en la mayoría de los juegos de caracteres latinos integrados en una gran variedad de diseños, fuentes y estilos, y superpuestos a objetos de fondo con varias orientaciones, como carteles y pancartas.

Por ejemplo, en las aplicaciones para compartir imágenes y de redes sociales, ahora puede activar la búsqueda visual basada en un índice de imágenes que contienen las mismas palabras clave. En las aplicaciones multimedia y de entretenimiento, puede catalogar vídeos basándose en texto relevante de la pantalla, como anuncios, noticias, resultados deportivos y subtítulos. Además, en las aplicaciones de seguridad, puede identificar vehículos basándose en los números de matrícula de las imágenes tomadas por las cámaras situadas en la vía pública.

“Como plataforma visual, Pinterest depende en gran medida de la velocidad y la calidad de las imágenes, pero el texto que contienen es igualmente importante, ya que proporciona contexto y permite que nuestros más de doscientos millones de usuarios activos puedan actuar sobre los Pines. Al trabajar con la función Texto en imágenes de Amazon Rekognition, podemos extraer mejor el texto enriquecido capturado en las imágenes a gran escala y con baja latencia para los millones de Pines almacenados en Amazon S3. Esperamos continuar desarrollando nuestra asociación con AWS para obtener experiencias rápidas y de alta calidad para nuestros usuarios y para las empresas que confían en Pinterest”. - Vanja Josifovski, director de tecnología, Pinterest

“Los fotógrafos profesionales a menudo utilizan SmugMug para compartir y vender fotografías que contienen texto, como por ejemplo, los números de los dorsales de las carreras de maratón. La función Texto en imágenes de Amazon Rekognition nos permite extraer números de dorsales mediante programación a gran escala y proporcionar a los fotógrafos de eventos una funcionalidad incluso mayor para compartir y vender fotografías de estos eventos de forma rápida y sencilla. ” - Don MacAskill, cofundador, director ejecutivo y geek principal de SmugMug
 

Búsqueda y detección facial: con Amazon Rekognition, ahora puede realizar búsquedas faciales en tiempo real con colecciones de decenas de millones de caras. Esto representa una reducción entre 5 y 10 veces en la latencia de búsqueda, al tiempo que permite utilizar colecciones que pueden almacenar entre 10 y 20 veces más caras que antes.

En aplicaciones de seguridad, ahora puede identificar personas de interés frente a una colección de millones de caras casi en tiempo real, lo que permite casos de uso como la prevención de delitos oportuna y precisa. La oficina del sheriff del condado de Washington es la encargada de responder en primera instancia a las llamadas de emergencia al 911 de los ciudadanos en Oregón. La oficina también proporciona apoyo para la prevención de delitos a los departamentos de policía de otras ciudades de todo el condado. La oficina del sheriff había utilizado previamente Amazon Rekognition para reducir el tiempo de identificación de sospechosos de 2 a 3 días a minutos.

“Estas mejoras permiten a los agentes sobre el terreno recibir la respuesta a las búsquedas casi en tiempo real. Esto les permite obtener la información que necesitan y actuar con rapidez. Cuando actúas sobre el terreno, unos segundos menos pueden salvar una vida”. Chris Adzima, analista sénior de sistemas de información de la oficina del sheriff del condado de Washington.

A partir hoy, los clientes también pueden detectar, analizar e indexar hasta 100 rostros (en vez de 15) en una sola imagen. Con esta mejora, es posible capturar con precisión datos demográficos y analizar sentimientos para todos los rostros en fotografías de grupo, eventos multitudinarios y ubicaciones públicas, como aeropuertos y grandes almacenes.
 

Para comenzar a utilizar las funciones Texto en imágenes, Búsqueda facial y Detección de rostros, descargue el SDK más reciente o simplemente inicie sesión en la consola de Amazon Rekognition para probarlas con las imágenes de muestra suministradas o con sus propias imágenes. Para obtener más información, consulte las secciones sobre texto en imágenes, búsqueda facial y detección de rostros en la documentación de Amazon Rekognition.