Mayor precisión en la detección de objetos y escenas en Amazon Rekognition permite conocer la ubicación de los objetos en las imágenes

Publicado en: Nov 2, 2018

Amazon Rekognition es un servicio de análisis de imágenes y videos basado en aprendizaje profundo capaz de identificar objetos, personas, texto, escenas y actividades, además de detectar contenido no seguro. Hoy presentamos una actualización importante relacionada con la detección de escenas y objetos, también conocida como detección de etiquetas. La detección de etiquetas identifica objetos y escenas en imágenes. Hasta ahora, Amazon Rekognition podía identificar la presencia de un objeto en una imagen, pero no podía encontrar la ubicación del objeto dentro de la imagen. Amazon Rekognition ahora puede especificar la ubicación de objetos comunes, como perros, personas y automóviles en una imagen mediante recuadros delimitadores de objetos. Además, ahora incluye un nivel de precisión que se mejoró de manera significativa para todas las etiquetas de escenas y objetos existentes en diferentes casos de uso. Además, los clientes pueden usar la información del recuadro delimitador para inferir qué cantidad de cada objeto ("3 perros") hay en la imagen y la relación entre los objetos ("perro sobre un sofá"). Todas las mejoras se ofrecen sin costo adicional.

Los clientes que se desempeñan en compañías de los sectores de noticias, deportes y redes sociales deben trabajar con bibliotecas de imágenes que crecen con rapidez. Por lo tanto, necesitan maneras de realizar búsquedas e implementar filtros en dicho contenido con rapidez. Los metadatos provistos manualmente funcionan hasta un determinado nivel para dichas aplicaciones, pero esa estrategia tiene un grado limitado de precisión y escalabilidad. Con la detección de escenas y objetos de Amazon Rekognition, los clientes pueden indexar automáticamente enormes bibliotecas de imágenes, lo que permite realizar búsquedas en ellas.

"GuruShots conecta e inspira a millones de aficionados de la fotografía en todo el mundo. Reinventa la manera en la que las personas interactúan con sus fotos y logra que la experiencia sea más divertida, interesante y gratificante. Anteriormente, los usuarios finales debían etiquetar manualmente las imágenes para obtener información más precisa. A los fines de ofrecer una mejor experiencia de cliente, hemos buscado maneras escalables para etiquetar automáticamente las imágenes cargadas y poder realizar más análisis. Gracias a Amazon Rekognition, ahora etiquetamos cada imagen cargada por un usuario y utilizamos los metadatos generados para detectar tendencias, mejorar los resultados de las búsquedas y ajustar el contenido a fin de adaptarlo a las preferencias de los usuarios. Mediante este nuevo proceso optimizado, se logró un aumento del 40 % en la retención de usuarios y un 50 % en la interacción". – Eran Hazout, fundador y CTO, GuruShots

Ahora, con los recuadros delimitadores de objetos, los clientes pueden contar qué cantidad de cada objeto aparece en una imagen ("3 perros"), además de determinar qué objetos se destacan o son más importantes en relación con otros mediante el uso de coordenadas de posición y el tamaño de los recuadros delimitadores en relación con las dimensiones de las imágenes. Esta información se puede usar para tomar decisiones vinculadas con las preferencias de los usuarios. Por ejemplo, alguien que tenga un montón de fotos en las que "automóvil" se destaque probablemente sea un fanático de los autos. Algunos clientes también utilizarán recuadros delimitadores para realizar un procesamiento más detallado de las imágenes, por ejemplo, para difuminar determinados objetos, como armas. La información de los recuadros delimitadores también se puede utilizar para buscar tipos específicos de imágenes (imágenes con varios perros o perros que se destaquen, a diferencia de un perro que aparezca en el fondo). A fin de incrementar el nivel de eficiencia de la búsqueda en recursos, Amazon Rekognition ahora provee etiquetas principales en una lista con orden jerárquico. Por ejemplo, la etiqueta "perro" incluye "mamífero", "canino" y "animal". Estos metadatos permiten a los clientes agrupar etiquetas vinculadas por relaciones entre elementos principales y secundarios a fin de mejorar la categorización y los filtros.

Los recuadros delimitadores, los metadatos jerárquicos y el incremento del nivel de precisión en la detección de etiquetas se encuentran disponibles actualmente en todas las regiones en las que se ofrece la característica de reconocimiento de imágenes de Amazon Rekognition. Próximamente se encontrarán disponibles las mejoras en las etiquetas para Amazon Rekognition Video. Puede empezar a usar las mejoras mediante la consola de Rekognition o a través de la descarga del SDK de AWS más reciente. Consulte la documentación para obtener más información.

Mayor precisión en la detección de objetos y escenas en Amazon Rekognition permite conocer la ubicación de los objetos en las imágenes

Finalización de la compatibilidad con Internet Explorer