Aspectos generales

P: ¿Qué es Amazon Rekognition?

Amazon Rekognition es un servicio que facilita la incorporación de un potente análisis visual a sus aplicaciones. Rekognition Image le permite crear potentes aplicaciones para la búsqueda, verificación y organización de millones de imágenes. Rekognition Video le permite extraer contexto basado en movimiento de vídeos almacenados o transmitidos en directo, y le ayuda a analizarlos.

Rekognition Image es un servicio de reconocimiento de imágenes que detecta objetos, escenas y rostros; extrae texto, reconoce a personas famosas e identifica contenido inapropiado en imágenes. También le permite realizar búsquedas y comparar rostros. Rekognition Image se basa en la misma tecnología de aprendizaje profundo demostrada y altamente escalable desarrollada por los científicos de visión informática de Amazon para analizar miles de millones de imágenes al día para Prime Photos.

Rekognition Image utiliza modelos de redes neuronales profundas para detectar y etiquetar miles de objetos y escenas en sus imágenes, y añadimos constantemente nuevas etiquetas y características de reconocimiento facial al servicio. Con Rekognition Image, solo paga por las imágenes que analiza y los metadatos de rostros que almacena.

Rekognition Video es un servicio de reconocimiento en videos que permite detectar actividades, conocer el movimiento de las personas en un marco y reconocer objetos, personas famosas y contenido inapropiado en videos almacenados en Amazon S3 y en transmisiones de video en directo de Acuity. Rekognition Video permite detectar personas y realizar un seguimiento de ellas a lo largo de un video aunque no se puedan ver sus rostros, o incluso si la persona entra y sale de la escena. Por ejemplo, esta herramienta se podría utilizar en una aplicación que envíe una notificación en tiempo real cuando alguien entrega un paquete en su domicilio. Rekognition Video también permite indexara metadatos, como objetos, actividades, escenas, personas famosas y rostros para facilitar la realización de búsquedas en imágenes de vídeo.

P: ¿Qué es el aprendizaje profundo?

El aprendizaje profundo es un subcampo del aprendizaje automático y una rama importante de la inteligencia artificial. Su objetivo consiste en inferir abstracciones de nivel superior a partir de datos sin procesar usando un gráfico profundo con numerosas capas de procesamiento compuestas por múltiples transformaciones lineales y no lineales. El aprendizaje profundo está basado libremente en modelos de procesamiento y comunicación de la información en el cerebro. El aprendizaje profundo sustituye características artesanales con aquellas aprendidas a partir de cantidades muy grandes de datos anotados. El aprendizaje se produce estimando de forma repetitiva cientos de miles de parámetros en un gráfico profundo con algoritmos eficaces.

Varias arquitecturas de aprendizaje profundo, como las redes neurales profundas convolucionales (CNN) y las redes neurales recurrentes, se han aplicado a la visión informática, el reconocimiento del habla, el procesamiento del lenguaje natural y el reconocimiento del audio para producir resultados vanguardistas en diversas tareas.

Amazon Rekognition forma parte de la familia de servicios de Amazon AI. Los servicios de Amazon AI utilizan el aprendizaje profundo para comprender imágenes, convertir el texto en habla realista y crear interfaces de conversación de texto y voz intuitivas.

P: ¿Necesito experiencia con el aprendizaje profundo para utilizar Amazon Rekognition?

No. Con Amazon Rekognition, no es necesario crear, mantener ni actualizar canalizaciones de aprendizaje profundo.

Para lograr resultados precisos en tareas de visión informática complejas, como la detección de objetos y escenas, el análisis de rostros y el reconocimiento de rostros, los sistemas de aprendizaje profundo deben perfeccionarse de manera adecuada y entrenarse con cantidades masivas de datos reales de campo etiquetados. El aprovisionamiento, la limpieza y el etiquetado precisos de datos es una tarea cara que requiere mucho tiempo. Además, entrenar una red neural profunda resulta caro en cuanto a recursos informáticos y a menudo requiere que se cree hardware personalizado con unidades de procesamiento gráfico (GPU).

Amazon Rekognition está totalmente administrado y viene preentrenado para realizar tareas de reconocimiento de imágenes y vídeos, por lo que no ha de invertir tiempo y recursos en la creación de una canalización de aprendizaje profundo. Amazon Rekognition sigue mejorando la precisión de sus modelos al desarrollar los nuevos datos de entrenamiento obtenidos mediante el aprovisionamiento y la investigación más recientes. Eso le permite concentrarse en el diseño y desarrollo de aplicaciones de gran valor.

P: ¿Cuáles son los casos de uso más comunes de Amazon Rekognition?

Los casos de uso más comunes de Rekognition Imagen incluyen:

  • Biblioteca de imágenes buscables
  • Verificación de usuarios basada en el rostro
  • Análisis de opiniones
  • Reconocimiento facial
  • Moderación de imágenes

Los casos de uso más comunes de Rekognition Video incluyen:

  • Índice de búsqueda para archivos de vídeo
  • Filtrado sencillo de vídeo en busca de contenido explícito o sugestivo

P: ¿Cómo puedo comenzar a utilizar Amazon Rekognition?  

Si todavía no se ha inscrito para utilizar Amazon Rekognition, puede hacer clic en el botón “Try Amazon Rekognition” de la página de Amazon Rekognition y completar el proceso de inscripción. Debe disponer de una cuenta de Amazon Web Services. Si aún no dispone de una, se le pedirá que la cree cuando inicie el proceso de inscripción. Una vez completada la inscripción, pruebe Amazon Rekognition con sus propias imágenes o vídeos utilizando la consola de administración de Amazon Rekognition o descargue los SDK de Amazon Rekognition para comenzar a crear sus propias aplicaciones. Para obtener más información, consulte nuestra Guía de introducción.

P: ¿Qué API ofrece Amazon Rekognition? 

Amazon Rekognition Image ofrece API que detectan objetos y escenas, detectan y analizan rostros, reconocen a personajes famosos, detectan contenidos inapropiados y buscan rostros similares en una colección, así como API de administración de recursos. Rekognition Image también ofrece API para comparar rostros y extraer texto, mientras que Rekognition Video también ofrece API para llevar a cabo un seguimiento de personas y gestionar transmisiones de vídeo en directo de Acuity. Para obtener más información, consulte la referencia de la API de Amazon Rekognition.

P: ¿Qué formatos de imagen y vídeo admite Amazon Rekognition? 

En la actualidad, Amazon Rekognition Image admite los formatos de imagen JPEG y PNG. Puede enviar imágenes como objeto de S3 o matriz de bytes. Las operaciones de Amazon Rekognition Video pueden analizar vídeos almacenados en buckets de Amazon S3. El vídeo debe estar codificado con el códec H.264. Los formatos de archivo admitidos son MPEG-4 y MOV. Un códec es software o hardware que comprime los datos para lograr un suministro más rápido y que descomprime los datos recibidos en su forma original. El códec H.264 se utiliza habitualmente para la grabación, compresión y distribución de contenidos de vídeo. Un formato de archivo de vídeo puede contener uno o más códecs. Si su vídeo con formato MOV o MPEG-4 no funciona con Rekognition Video, compruebe si el códec utilizado para codificar el vídeo es el H.264.

P: ¿Qué tamaño de archivos puedo usar con Amazon Rekognition? 

Amazon Rekognition Image admite tamaños de archivos de imágenes de hasta 15 MB cuando se envían como objeto de S3, y de hasta 5 MB cuando se envían como matrices de bytes. Amazon Rekognition Video admite archivos de hasta 8 GB y vídeos de hasta 2 horas de duración cuando se pasan a través de un archivo S3.

P: ¿Cómo influye la resolución de la imagen en la calidad de los resultados de la API de Rekognition Image? 

Amazon Rekognition admite una gran variedad de resoluciones de imagen. Para obtener los mejores resultados, recomendamos el uso de una resolución VGA (640x480) o superior. Si la resolución es inferior a QVGA (320x240), hay bastantes probabilidades de que no puedan identificarse rostros, objetos o contenido inapropiado, aunque Amazon Rekognition acepta cualquier imagen que tenga al menos 80 píxeles en ambas dimensiones.

P: ¿Cuál es el tamaño mínimo que puede tener un objeto para que Amazon Rekognition Image lo detecte y analice? 

Por lo general, asegúrese de que el objeto o rostro más pequeño presente en la imagen tenga al menos el 5% del tamaño (en píxeles) de la dimensión más corta de la imagen. Por ejemplo, si trabaja con una imagen de 1600x900, el objeto o rostro más pequeño debería tener al menos 45 píxeles en cada dimensión.

P: ¿Cómo influye la resolución del vídeo en la calidad de los resultados de la API de Rekognition Video? 

El sistema está programado para reconocer rostros con un tamaño superior a 32 píxeles (en la dimensión más reducida), que se traduce en un tamaño mínimo para el reconocimiento de un rostro que varía entre aproximadamente 1/7 de la dimensión más reducida de la pantalla con una resolución QVGA hasta 1/30 con una resolución HD 1080p. Por ejemplo, con una resolución VGA, los usuarios deben esperar rendimientos más bajos para rostros con un tamaño inferior a 1/10 de la dimensión más reducida de la pantalla.

P: ¿Qué otros factores pueden influir en la calidad de las API de Rekognition Video?

Además de la resolución del vídeo, un desenfoque importante, personas moviéndose de forma rápida, las condiciones de iluminación y la postura pueden influir en la calidad de las API.

P: ¿Cuál es el contenido de vídeo para usuarios más adecuado para las API de Rekognition Video?

Esta API funciona mejor con vídeos de aficionados y profesionales obtenidos con un campo frontal de visión con condiciones normales de color e iluminación. Esta API no se ha comprobado para imágenes en blanco y negro, IR o condiciones de iluminación extremas. Se recomienda que las aplicaciones sensibles a falsas alarmas desechen las imágenes con un nivel de confianza inferior a un nivel de confianza seleccionado (específico para cada aplicación).

P: ¿En qué regiones de AWS se encuentra disponible Amazon Rekognition? 

Actualmente, Amazon Rekognition Image se encuentra disponible en las regiones EE.UU. Este (Norte de Virginia), EE.UU. Oeste (Oregón), EE.UU. Este (Ohio) , UE (Irlanda), Asia Pacífico (Tokio), Asia Pacífico (Sídney) y AWS GovCloud (EE.UU.). Amazon Rekognition Video se encuentra disponible en las regiones EE.UU. Este (Norte de Virginia), EE.UU. Oeste (Oregón), EE.UU. Este (Ohio) , UE (Irlanda), Asia Pacífico (Tokio) y Asia Pacífico (Sídney). El streaming en tiempo real de Amazon Rekognition se encuentra disponible únicamente en las regiones EE.UU. Este (Norte de Virginia), EE.UU. Oeste (Oregón), UE (Irlanda) y Asia Pacífico (Tokio).

Detección de objetos y escenas

P: ¿Qué es una etiqueta?

Una etiqueta es un objeto, una escena o un concepto que se encuentra en una imagen basados en sus contenidos. Por ejemplo, una foto de varias personas en una playa tropical puede contener etiquetas como "Person", "Water", "Sand", "Palm Tree" y "Swimwear" (objetos), "Beach" (escena) y "Outdoors" (concepto).  

P: ¿Qué es la puntuación de confianza y cómo puedo utilizarla?

Una puntuación de confianza es un número entre 0 y 100 que indica la probabilidad de que una predicción determinada sea correcta. En el ejemplo de la playa tropical, si el proceso de detección de objetos y escenas muestra una puntuación de confianza de 99 para la etiqueta "Water" y 35 para la etiqueta "Palm Tree", es más probable que la imagen contenga agua pero no una palmera.

Las aplicaciones muy sensibles a los errores de detección (positivos falsos) deberían descartar los resultados asociados con las puntuaciones de confianza por debajo de un umbral determinado. El umbral óptimo depende de la aplicación. En muchos casos, obtendrá la mejor experiencia para los usuarios si configura los valores de confianza mínima por encima del valor predeterminado.

P: ¿Qué es la detección de objetos y escenas?

La detección de objetos y escenas se refiere al proceso de analizar una imagen o vídeo para asignar etiquetas en función de su contenido visual. Amazon Rekognition Image lo hace a través de la API DetectLabels. Esta API le permite identificar automáticamente miles de objetos, escenas y conceptos y muestra una puntuación de confianza para cada etiqueta. DetectLabels utiliza un umbral de confianza predeterminado de 50. La detección de objetos y escenas es ideal para clientes que desean buscar y organizar bibliotecas de imágenes de gran tamaño, incluidas aplicaciones de consumo y estilo de vida que dependen del contenido generado por los usuarios y compañías tecnológicas que desean mejorar sus algoritmos de focalización.

P: ¿Qué tipos de etiquetas admite Amazon Rekognition?  

Rekognition admite miles de etiquetas que pertenecen a categorías comunes incluidas, entre otras:

  • Personas y eventos: "Wedding", "Bride", "Baby", "Birthday Cake", "Guitarist", etc.
  • Alimentos y bebida: "Apple", "Sandwich", "Wine", "Cake", "Pizza", etc.
  • Naturaleza y aire libre: "Beach", "Mountains", "Lake", "Sunset", "Rainbow", etc.
  • Animales y mascotas: "Dog", "Cat", "Horse", "Tiger", "Turtle", etc.
  • Hogar y jardín: "Bed", "Table", "Backyard", "Chandelier", "Bedroom", etc.
  • Deportes y ocio: "Golf", "Basketball", "Hockey", "Tennis", "Hiking", etc.
  • Plantas y flores: "Rose", "Tulip", "Palm Tree", "Forest", "Bamboo", etc.
  • Arte y entretenimiento: "Sculpture", "Painting", "Guitar", "Ballet", "Mosaic", etc.
  • Transporte y vehículos: "Airplane", "Car", "Bicycle", "Motorcycle", "Truck", etc.
  • Electrónica: "Computer", "Mobile Phone", "Video Camera", "TV", "Headphones", etc.

Q. ¿En qué se diferencia la detección de objetos y escenas para el análisis de vídeo?

Rekognition Video le permite identificar de forma automática miles de objetos, como vehículos y mascotas, y actividades, como celebraciones o bailes, y le ofrece indicaciones de fecha y hora y una puntuación del nivel de confianza para cada etiqueta. También se basa en el movimiento y en el contexto temporal del vídeo para identificar de forma precisa actividades complejas, como "soplar una vela" o "apagar un fuego".

P: No puedo encontrar la etiqueta que necesito. ¿Cómo puedo solicitar una etiqueta nueva?

Envíenos sus solicitudes a través de Soporte para clientes de AWS. Amazon Rekognition amplía constantemente su catálogo de etiquetas en función de los comentarios de los clientes.

Detección de contenidos inseguros

P. ¿Qué es la detección de contenidos inseguros?

La Detección de contenidos inseguros de Amazon Rekognition es una API sencilla basada en el aprendizaje profundo para la detección de contenido adulto explícito y sugerente en imágenes. Los desarrolladores pueden usar estos metadatos adicionales para filtrar contenido inapropiado basado en sus necesidades comerciales. Además de marcar una imagen de acuerdo con la presencia de contenido para adultos, Moderación de imágenes también devuelve una lista jerárquica de etiquetas con puntuaciones de confianza. Estas etiquetas indican categorías específicas de contenido para adultos, lo que proporciona un mayor control granular a los desarrolladores para filtrar y administrar grandes volúmenes de contenido generado por el usuario. Esta API puede utilizarse en flujos de trabajo de moderación para aplicaciones como sitios sociales y de citas, plataformas de intercambio de fotos, blogs y foros, aplicaciones para niños, sitios de comercio electrónico, entretenimiento y servicios de publicidad en línea.

P. ¿Qué tipos de contenido explícito y sugerente para adultos detecta Amazon Rekognition?

Amazon Rekognition detecta los siguientes tipos de contenido explícito y sugerente para adultos en las imágenes:

  • Desnudos explícitos
  • Desnudos
  • Desnudos masculinos explícitos
  • Desnudos femeninos explícitos
  • Actividad sexual
  • Desnudos parciales
  • Contenido sugerente
  • Trajes de baño o ropa interior femenina
  • Trajes de baño o ropa interior masculina
  • Ropa provocativa

La API de Detección de imágenes inseguras de Amazon Rekognition devuelve una jerarquía de etiquetas, así como una puntuación de confianza para cada etiqueta detectada. Por ejemplo, dada una imagen inapropiada, Rekognition puede devolver "Desnudo explícito" con una puntuación de confianza de etiqueta de nivel superior. Los desarrolladores podrían usar este procedimiento para marcar contenido. En la misma respuesta, Rekognition también devuelve el segundo nivel de granularidad proporcionando un contexto adicional como "Desnudo masculino explícito" con su propia puntuación de confianza. Los desarrolladores podrían utilizar esta información para crear una lógica de filtrado más compleja.

Tenga en cuenta que la API de detección de imágenes inseguras no es una autoridad o pretende ser un filtro exhaustivo de contenido explícito y sugerente para adultos. Además, esta API de detección de imágenes inseguras no detecta si una imagen incluye contenido ilegal (como pornografía infantil) o contenido adulto no natural.

P. ¿Puede la API de Detección de contenidos inseguros de Amazon Rekognition detectar otros contenidos inapropiados además del contenido explícito y sugerente para adultos?

Actualmente, Rekognition solo admite las etiquetas que hemos descrito anteriormente. Trabajaremos para agregar y mejorar continuamente etiquetas basadas en los comentarios de nuestros clientes.
Si necesita detectar otros tipos de contenido inapropiado en las imágenes, póngase en contacto con nosotros mediante el proceso de comentarios descrito más adelante en esta sección.

Q. ¿En qué se diferencia la detección de contenidos inseguros para el análisis de vídeo?

Rekognition Video le permite identificar de forma automática contenido para adultos explícito o sugerente, y también le ofrece indicaciones de fecha y hora y una puntuación del nivel de confianza para cada etiqueta de tipo de contenido.

P. ¿Cómo puedo asegurarme de que Rekognition cumple con el uso de detección de imágenes y vídeos para adultos que necesito?

Los modelos de Detección de contenidos inseguros de Rekognition se han sometido a pruebas y se han ajustado, pero recomendamos que mida la precisión de sus propios conjuntos de datos para valorar el desempeño.

Puede utilizar el parámetro "MinConfidence" en las solicitudes de API para equilibrar la detección de contenido (recall) frente a la precisión de la detección (precision). Si reduce "MinConfidence", es probable que detecte la mayor parte del contenido inapropiado, pero también es probable que recoja contenido que no sea realmente explícito o sugerente. Si aumenta "MinConfidence", es probable que se asegure de que todo el contenido detectado sea realmente explícito o sugerente, pero algunos contenidos inapropiados no se podrán etiquetar. Para obtener ejemplos sobre cómo usar "MinConfidence" para imágenes, consulte la documentación aquí.

En caso de que Rekogntion no detecte contenido de adultos en imágenes o vídeos, póngase en contacto con nosotros mediante el proceso de comentarios descrito a continuación.

P. ¿Cómo puedo enviar comentarios a Rekognition para mejorar su detección de contenidos inseguros? 

Envíenos sus solicitudes a través de Soporte para clientes de AWS. Amazon Rekognition amplía continuamente los tipos de contenido inapropiado detectado en función de los comentarios de los clientes. Normalmente se tarda entre 6 y 8 semanas en agregar nuevos tipos de contenido para adultos explícito o sugerente. Tenga en cuenta que los contenidos ilegales (como la pornografía infantil) no serán aceptados a través de este proceso.

Análisis facial

P: ¿Qué es el análisis facial?

El análisis facial es el proceso de detección de un rostro en una imagen y la extracción de atributos faciales relevantes del mismo. Amazon Rekognition Image ofrece recuadros que rodean cada rostro detectado en una imagen junto con atributos como el sexo, la presencia de gafas de sol y puntos de referencia del rostro. Rekognition Video ofrecerá los rostros detectados en un vídeo con indicaciones de fecha y hora, y para cada rostro detectado, la posición y un recuadro que rodeará cada rostro con los puntos de referencia del rostro.

P: ¿Qué atributos faciales puedo obtener de Amazon Rekognition?

Amazon Rekognition muestra los siguientes atributos faciales para cada rostro detectado, así como un recuadro que lo rodea y una puntuación de confianza para cada atributo:

  • Sexo
  • Sonrisa
  • Emociones
  • Gafas
  • Gafas de sol
  • Ojos abiertos
  • Boca abierta
  • Bigote
  • Barba
  • Postura
  • Calidad
  • Puntos de referencia del rostro

P: ¿Qué es la postura del rostro?

La postura del rostro se refiere a la rotación del rostro detectado en los ejes de inclinación, balanceo y oscilación. Cada uno de estos parámetros se muestra como ángulo entre -180 y +180 grados. La postura del rostro se puede utilizar para encontrar la orientación del polígono que rodea el rostro (en lugar del recuadro que lo rodea), para medir la deformación, monitorizar rostros con precisión y más.

P: ¿Qué es la calidad del rostro?

La calidad del rostro describe la calidad de la imagen del rostro detectado con dos parámetros: nitidez y brillo. Ambos parámetros se muestran como valores entre 0 y 1. Puede aplicar un umbral a estos parámetros para filtrar rostros bien iluminados y nítidos. Esto resulta útil para aplicaciones que se benefician de imágenes de gran calidad, como la comparación de rostros y el reconocimiento de rostros.

P: ¿Qué son los puntos de referencia del rostro?

Los puntos de referencia del rostro son un conjunto de puntos prominentes, normalmente localizados en las esquinas, puntas o puntos centrales de componentes principales del rostro, como los ojos, la nariz y la boca. La API DetectFaces de Amazon Rekognition muestra un conjunto de puntos de referencia del rostro que se pueden utilizar para recortar rostros, cambiar un rostro por otro, superponer marcas personalizadas para crear filtros personalizados, y más.

P: ¿Cuántos rostros se pueden detectar en una imagen?

Con Amazon Rekognition, se pueden detectar hasta 100 rostros en una imagen.

Q. ¿En qué se diferencia el análisis facial para el análisis de vídeo?

Con Rekognition Video, puede localizar rostros en un vídeo y analizar atributos faciales, como si la persona está sonriendo, si tiene los ojos abiertos o si muestra emociones. Rekognition Video ofrecerá los rostros detectados con indicaciones de fecha y hora, y para cada rostro detectado, la posición y un recuadro que rodeará cada rostro con los puntos de referencia del rostro, como el ojo izquierdo, el ojo derecho, la esquina izquierda de la boca y la esquina derecha de la boca. Esta información de la posición y de la fecha y hora se puede utilizar para realizar un seguimiento de la actitud del usuario en el tiempo y para ofrecer funciones adicionales, como marcos automáticos para rostros, identificación de aspectos destacados o zonas recortadas.

P: Además de la resolución del vídeo, ¿qué otros factores pueden influir en la calidad de las API de Rekognition Video?

Además de la resolución del vídeo, la calidad y los rostros representativos, las colecciones de las partes del rostro que se pretenden buscar, tienen una gran influencia. El uso de diferentes instancias de rostros para cada persona, con variaciones como barbas, gafas, posturas (perfil y frontal) mejorarán el rendimiento de forma significativa. Normalmente los vídeos con imágenes borrosas o con personas que se mueven de forma rápida pueden tener una calidad inferior.

Comparación de rostros

P: ¿Qué es la comparación de rostros? 

La comparación de rostros es el proceso de comparar un rostro con uno o más rostros para medir la similitud. Mediante la API CompareFaces, Amazon Rekognition Image le permite medir la probabilidad de que dos rostros de dos imágenes pertenezcan a la misma persona. La API compara un rostro en la imagen de entrada de origen con cada rostro detectado en la imagen de entrada de destino y muestra una puntuación de similitud para cada comparación. También aparece un recuadro que rodea el rostro y una puntuación de confianza para cada rostro detectado. Puede utilizar la comparación de rostros para verificar la identidad de una persona comparando su foto de empleado registrada en casi tiempo real.

P: ¿Puedo utilizar una imagen de origen con más de un rostro? 

Sí. Si la imagen de origen contiene varios rostros, CompareFaces detecta el rostro de mayor tamaño y lo compara con cada rostro detectado en la imagen de destino.

P: ¿Con cuántos rostros puedo realizar la comparación?

Puede comparar un rostro en la imagen de origen con un máximo de 15 rostros detectados en la imagen de destino.

Reconocimiento facial

P: ¿Qué es el reconocimiento facial?

El reconocimiento facial es el proceso de identificar o verificar la identidad de una persona buscando su rostro en una colección de rostros. Con el reconocimiento de rostros, puede crear aplicaciones fácilmente como la autenticación multifactor para pagos bancarios, la entrada automatizada al edificio para empleados y muchos otros.

P: ¿Qué es una colección de rostros y cómo puedo crear una?  

Una colección de rostros es un índice buscable de vectores de características faciales, propiedad suya y que usted administra. Con la API CreateCollection, puede crear de manera sencilla una colección en una región de AWS admitida y obtener un nombre de recursos de Amazon (ARN). Cada colección de rostros tiene un CollectionId asociado.

P: ¿Cómo puedo añadir o eliminar rostros en la colección de rostros? 

Para añadir un rostro a una colección de rostros existente, utilice la API IndexFaces. Esta API acepta una imagen en formato de objeto de S3 o matriz de bytes y añade una representación vectorial de los rostros detectados en la colección. IndexFaces también muestra un ID de rostro y recuadro que rodea al rostro para cada rostro añadido.

Para eliminar un rostro en una colección de rostros existente, utilice la API DeleteFaces. Esta API funciona en la colección de rostros proporcionada (con un CollectionId) y elimina las entradas correspondientes a la lista FaceIds. Para obtener más información sobre cómo añadir y eliminar rostros, consulte nuestro ejemplo sobre la administración de colecciones.

P: ¿Cómo puedo buscar un rostro en una colección de rostros? 

Una vez que haya creado una colección de rostros indexada, puede buscar un rostro en ella usando una imagen (SearchFaceByImage) o un ID de rostro (SearchFaces). Estas API toman un rostro de origen y muestran un conjunto de rostros que coinciden con él, ordenados de mayor a menor puntuación de similitud. Para obtener más información, consulte nuestro ejemplo sobre la búsqueda de rostros.

Q. ¿En qué se diferencia el reconocimiento facial para el análisis de vídeo?

Rekognition Video le permite realizar búsquedas de rostros en tiempo real mediante comparaciones con colecciones de decenas de millones de rostros. En primer lugar, debe crear una colección de rostros donde poder almacenar rostros, es decir, representaciones vectoriales de características faciales. A continuación, Rekognition busca en la colección rostros similares visualmente presentes en el vídeo. Rekognition mostrará una puntuación de confianza para cada uno de los rostros del video, de manera que pueda mostrar coincidencias probables en su aplicación.

P: Además de la resolución del vídeo, ¿qué otros factores pueden influir en la calidad de las API de Video?

Además de la resolución del vídeo, la calidad y los rostros representativos, las colecciones de las partes del rostro que se pretenden buscar, tienen una gran influencia. El uso de diferentes instancias de rostros para cada persona, con variaciones como barbas, gafas, posturas (perfil y frontal) mejorarán el rendimiento de forma significativa. Normalmente, los vídeos con personas que se mueven de forma rápida pueden tener un menor número de recuperaciones. Además, los vídeos con imágenes borrosas pueden tener una calidad inferior.

Reconocimiento de famosos

P: ¿Qué es el reconocimiento de famosos?

El Reconocimiento de famosos de Amazon Rekognition es una API fácil de utilizar basada en el aprendizaje intensivo que sirve para la detección y el reconocimiento de personas famosas, destacadas o importantes en su ámbito. La API RecognizeCelebrities ha sido diseñada para funcionar a escala y reconocer a famosos de una serie de categorías, como la política, los deportes, los negocios, el entretenimiento y los medios. Nuestra característica de reconocimiento de famosos es perfecta para clientes que deseen indexar y buscar famosos en sus bibliotecas digitales de imágenes según sus intereses particulares.

P: ¿A quién se puede identificar con la API de reconocimiento de famosos?

Amazon Rekognition solo puede identificar a famosos cuyo reconocimiento se haya programado en los modelos de aprendizaje intensivo. Tenga en cuenta que la API RecognizeCelebrities no es, ni pretende ser, una fuente de referencia ni una lista exhaustiva de famosos. La característica se ha diseñado para incluir tantos famosos como sea posible, según las necesidades y los comentarios de nuestros clientes. Estamos añadiendo nombres nuevos constantemente, pero el hecho de que el Reconocimiento de famosos no reconozca a personas que podrían ser consideradas como tales por determinados grupos o por nuestros clientes no refleja nuestra opinión sobre su celebridad. Si desea que el Reconocimiento de famosos identifique a determinadas personas, envíenos sus comentarios.

P: ¿Una persona famosa que sea identificada a través de la API de Amazon Rekognition puede solicitar su eliminación?

Sí. Si una persona famosa desea que se le quite de la característica, puede enviar un correo electrónico al servicio de atención al cliente de AWS y procesaremos su solicitud.

P: ¿De qué fuentes dispone para aportar información adicional sobre un famoso?

La API admite una lista opcional de fuentes para ofrecer información adicional sobre el famoso, como parte de sus resultados. Actualmente ofrecemos la URL de IMDB, cuando está disponible. Es posible que más adelante añadamos otras fuentes.

Q. ¿En qué se diferencia el reconocimiento de famosos para el análisis de vídeo?

Con Rekognition Video, podrá detectar y reconocer cuándo y dónde aparecen personas conocidas en un vídeo. La salida con tiempo codificado incluye el nombre y el identificador único de la persona famosa, las coordenadas del recuadro que rodea el rostro, la puntuación de confianza y las direcciones URL con contenido relacionado con el famoso, por ejemplo, el enlace a IMDB. En ocasiones, también se puede detectar al personaje famoso incluso si su rostro aparece oculto en el vídeo. Esta función le permite indexar y realizar búsquedas en videotecas digitales para casos de uso relacionados con sus necesidades audiovisuales y de marketing específicas.

P: Además de la resolución del vídeo, ¿qué otros factores pueden influir en la calidad de las API de Rekognition Video?

Los vídeos con famosos moviéndose muy deprisa o con imágenes borrosas pueden afectar a la calidad de las API de Rekognition Video. Además, un maquillaje muy pronunciado y los atuendos de camuflaje que utilizan habitualmente los actores y actrices también pueden afectar a la calidad.

Texto en imágenes

P: ¿Qué es Texto en imágenes?

Texto en imágenes es una capacidad de Amazon Rekognition que le permite detectar y reconocer texto en una imagen, como nombres de calles, títulos, nombres de productos y patentes de vehículos. La función Texto en imágenes está diseñada específicamente para trabajar con imágenes reales en vez de con imágenes de documentos. El API DetectText de Amazon Rekognition incorpora una imagen y devuelve la etiqueta de texto y un cuadro de límite para cada cadena de caracteres detectada, junto con una puntuación de confianza. Por ejemplo, en aplicaciones de redes sociales y para compartir imágenes, puede activar la búsqueda visual con base en un índice de imágenes que contenga las mismas etiquetas de texto. En aplicaciones de entretenimiento y medios, puede crear metadatos de texto para fotogramas de video para admitir la búsqueda de contenido relevante, como noticias, resultados deportivos, propagandas y títulos. En aplicaciones de seguridad y vigilancia, puede identificar vehículos en función de las patentes a partir de imágenes tomadas por cámaras de tránsito y de agentes de la policía.

P: ¿Qué tipo de texto admite la función Texto en imágenes de Amazon Rekognition? 

La función Texto en imágenes está diseñada específicamente para trabajar con imágenes reales en vez de con imágenes de documentos. Reconoce textos escritos en la mayoría de los alfabetos latinos y números incorporados en una amplia variedad de diseños, fuentes y estilos, y superpuestos en objetos en segundo plano con varias orientaciones, como banners y pósteres. Texto en imágenes reconoce hasta 50 secuencias de caracteres por imagen y las incluye en una lista como palabras o líneas. Además, Texto en imágenes reconoce únicamente texto horizontal con una orientación de +/- 30 grados.

P: ¿Cómo puedo enviar comentarios a Rekognition para mejorar el reconocimiento de texto?

Envíenos sus solicitudes a través de Soporte para clientes de AWS. Amazon Rekognition amplía continuamente los tipos de contenido con texto reconocido en función de los comentarios de los clientes.

Análisis de vídeos

P. ¿Cómo funcionan las API asíncronas de Amazon Rekognition Video? 

Rekognition Video procesa un vídeo almacenado en un bucket de Amazon S3. El patrón de diseño es un conjunto asíncrono de operaciones. Puede iniciar el análisis de vídeo realizando una llamada a una operación de Inicio (Start), como StartLabelDetection. El estado de finalización de la solicitud se publica en un tema de Amazon Simple Notification Service. Para obtener el estado de finalización del tema de Amazon, puede utilizar una cola de Amazon Simple Queue Service o una función de AWS Lambda. Tras obtener el estado de finalización, puede realizar una llamada a una operación Obtener (Get), como GetLabelDetection, para obtener los resultados de la solicitud.

 

P. ¿Qué es el seguimiento de personas? 

Con Rekognition Video, puede realizar un seguimiento de cada persona presente en una toma y a través de las diferentes tomas del vídeo. Rekognition Video detecta a las personas incluso con la cámara en movimiento y, para cada persona, devuelve un recuadro que rodea su rostro, además de los tributos del rostro e indicaciones de fecha y hora. En aplicaciones comerciales, esto permite generar información sobre los clientes, como por ejemplo, cómo se mueven los clientes por los diferentes pasillos de un centro comercial o cuánto tiempo deben esperar para pagar en las colas de caja.

P. ¿Cómo puedo analizar vídeos en tiempo real?  

En modo de transmisión, puede realizar búsquedas de rostros comparándolos con una colección de decenas de millones de rostros en tiempo real. Las API de detección y reconocimiento de rostros de Rekognition Video se integran de forma nativa con las transmisiones de vídeo de Amazon Kinesis Video Streams, un servicio que permite a los desarrolladores transmitir miles de fuentes en directo y metadatos asociados. En aplicaciones de seguridad, esto facilita la identificación en tiempo real de personas de interés y la hace más precisa.

P: ¿Amazon Rekognition Video funciona con Amazon Kinesis Video Streams? 

Rekognition Video utiliza un Kinesis Video Stream como entrada para procesar una transmisión de vídeo. Los resultados del análisis pasan de Rekognition Video a una transmisión de datos de Kinesis y, finalmente, son leídas por la aplicación de su cliente. Rekognition Video proporciona un procesador de transmisiones que puede utilizar para iniciar y gestionar el análisis de la transmisión de vídeo. Para obtener más información, consulte Trabajo con transmisión de vídeos.

Facturación

P: ¿Cómo cuenta Amazon Rekognition la cantidad de imágenes procesadas?

Para las API que aceptan imágenes como entrada, Amazon Rekognition cuenta la cantidad real de imágenes analizadas como la cantidad de imágenes procesadas. DetectLabels, DetectModerationLabels, DetectFaces, IndexFaces, RecognizeCelebrities y SearchFaceByImage pertenecen a esta categoría. En el caso de la API CompareFaces API, si se utilizan dos imágenes como entrada, solo la imagen de origen se cuenta como una unidad de imágenes procesada.

Para llamadas a la API que no requieren una imagen como parámetro de entrada, Amazon Rekognition cuenta cada llamada a una API como una imagen procesada. SearchFaces y ListFaces pertenecen a esta categoría.

Las demás API de Amazon Rekognition APIs (DeleteFaces, CreateCollection, DeleteCollection y ListCollections) no se suman a la cantidad de imágenes procesadas.

P: ¿Cómo cuenta Amazon Rekognition el número de minutos de vídeos procesados?

En el caso de los vídeos archivados, Amazon Rekognition cuenta los minutos de vídeo que ha podido procesar correctamente a través de la API y realiza los cálculos para la facturación. En el caso de los vídeos transmitidos en directo, se le cobrará por bloques de cinco segundos de vídeo procesados correctamente.

P: ¿Por qué API cobra Amazon Rekognition?

Amazon Rekognition Image cobra por el uso de las siguientes API: DetectLabels, DetectModerationLabels, DetectFaces, IndexFaces, RecognizeCelebrities, SearchFaceByImage, CompareFaces, SearchFaces y ListFaces. Amazon Rekognition Video cobra en función de la duración de los vídeos en minutos procesados correctamente por las API StartLabelDetection, StartFaceDetection, StartFaceDetection, SatrtContentModeration, StartPersonTracking, StartCelebrityRecognition, StartFaceSerach y StartStreamProcessor.

P: ¿Cuánto cuesta Amazon Rekognition?

Para obtener información actualizada sobre los precios, consulte la página de precios de Amazon Rekognition.

P: ¿Se me cobrará por los vectores de características que almaceno en mi colección de rostros?

Sí. Amazon Rekognition cobra 0,01 USD por 1 000 vectores faciales al mes. Para obtener más información, consulte la página de precios.

P: ¿Participa Amazon Rekognition en la capa gratuita de AWS?

Sí. Como parte de la capa de uso gratuita de AWS, puede comenzar a utilizar Amazon Rekognition de manera gratuita. Una vez inscritos, los clientes nuevos de Amazon Rekognition pueden analizar hasta 5 000 imágenes al mes de manera gratuita durante los primeros 12 meses. Como parte de la capa gratuita, puede utilizar todas las API de Amazon Rekognition, y también almacenar hasta 1 000 rostros sin cargo. Además, los clientes de Amazon Rekognition Video podrán analizar 1 000 minutos de vídeo de forma gratuita, cada mes, durante el primer año.

P: ¿Los impuestos están incluidos en los precios?

Para obtener más información sobre impuestos, consulte la ayuda sobre impuestos de Amazon Web Services.

Integración con AWS

P: ¿Funciona Amazon Rekognition Video con imágenes almacenadas en Amazon S3?

Sí. Puede comenzar a analizar imágenes almacenadas en Amazon S3 simplemente apuntando la API de Amazon Rekognition API a su bucket de S3. No es necesario que transfiera sus datos. Para obtener más información sobre cómo utilizar los objetos de S3 con llamadas a las API de Amazon Rekognition, consulte nuestro ejercicio sobre detección de etiquetas.

P: ¿Puedo utilizar Amazon Rekognition con imágenes guardadas en un bucket de Amazon S3 en otra región?

No. Asegúrese de que el bucket de Amazon S3 que quiere utilizar esté en la misma región que el punto de enlace de la API de Amazon Rekognition.

P: ¿Cómo puedo procesar varios archivos de imágenes en un lote con Amazon Rekognition?

Puede procesar sus imágenes de Amazon S3 por lotes siguiendo los pasos indicados en nuestro ejemplo de procesamiento por lotes de Amazon Rekognition en GitHub.

P: ¿Cómo puedo utilizar AWS Lambda con Amazon Rekognition?

Amazon Rekognition proporciona acceso sencillo a AWS Lambda y le permite añadir el análisis de imágenes basado en activadores a sus almacenes de datos de AWS, como Amazon S3 y Amazon DynamoDB. Para utilizar Amazon Rekognition con AWS Lambda, siga los pasos descritos aquí y seleccione uno de los planos de Amazon Rekognition disponibles.

P: ¿Amazon Rekognition es compatible con AWS CloudTrail?

Sí. Amazon Rekognition admite el registro de las siguientes acciones como eventos en archivos de log de CloudTrail: CreateCollection, DeleteCollection, CreateStreamProcessor, DeleteStreamProcessor, DescribeStreamProcessor, ListStreamProcessors y ListCollections. Si desea obtener más detalles sobre las llamadas a la API en Amazon Rekognition que están integradas con AWS CloudTrail, consulte Registro de llamadas a la API en Amazon Rekognition con AWS CloudTrail.

Privacidad de datos

P. ¿Se almacenan las entradas de imagen y vídeo procesadas por Amazon Rekognition y cómo las utiliza AWS?

Amazon Rekognition puede almacenar y utilizar las entradas de imagen y vídeo procesadas por el servicio únicamente para proporcionar y mantener el servicio, y para mejorar y desarrollar la calidad de Amazon Rekognition y otras tecnologías de aprendizaje automático / inteligencia artificial de Amazon. El uso de su contenido es necesario para la mejora continua de su experiencia como cliente de Amazon Rekognition, incluido el desarrollo y la formación relacionados con estas tecnologías. No utilizamos ninguna información que pueda permitir la identificación de personas y que esté incluida en su contenido para personalizar productos, servicios o actividades de marketing para usted o sus usuarios finales. Su confianza, privacidad y la seguridad de su contenido son nuestra más absoluta prioridad, por lo que implementamos controles físicos y técnicos adecuados y sofisticados, incluidos sistemas de cifrado para la información almacenada y en tránsito, diseñados para impedir el acceso no autorizado o que se divulgue su contenido y para garantizar que nuestro uso cumple con nuestro compromiso con usted. Para obtener más información, consulte https://aws.amazon.com/compliance/data-privacy-faq/.

P. ¿Puedo eliminar entradas de imagen y vídeo almacenadas por Amazon Rekognition?

Sí. Puede solicitar la eliminación de entradas de imagen y vídeo asociadas con su cuenta contactando con AWS Support. La eliminación de entradas de imagen y vídeo puede reducir la calidad de su experiencia con Amazon Rekognition.

P: ¿Quién tiene acceso a mi contenido procesado y almacenado por Amazon Rekognition?

Solo los empleados autorizados tendrán acceso a su contenido procesado por Amazon Rekognition. Su confianza, privacidad y la seguridad de su contenido son nuestra más absoluta prioridad, por lo que implementamos controles físicos y técnicos adecuados y sofisticados, incluidos sistemas de cifrado para la información almacenada y en tránsito, diseñados para impedir el acceso no autorizado o que se divulgue su contenido y para garantizar que nuestro uso cumple con nuestro compromiso con usted. Para obtener más información, consulte https://aws.amazon.com/compliance/data-privacy-faq/.

P: ¿Sigo siendo el propietario de mi contenido procesado y almacenado por Amazon Rekognition?

Siempre conservará la propiedad de su contenido y solo lo utilizaremos con su consentimiento.

P: ¿El contenido procesado por Amazon Rekognition se transmitirá fuera de la región de AWS en la que estoy utilizando Amazon Rekognition?

Todo el contenido procesado por Amazon Rekognition se cifra y almacena en la región de AWS en la que está utilizando Amazon Rekognition. Es posible que una parte del contenido procesado por Amazon Rekognition se almacene en otra región de AWS únicamente en relación con la mejora y desarrollo continuos de su experiencia como cliente de Amazon Rekognition y otras tecnologías de aprendizaje automático / inteligencia artificial de Amazon. Puede solicitar la eliminación de entradas de imagen y vídeo asociadas con su cuenta contactando con AWS Support. Su confianza, privacidad y la seguridad de su contenido son nuestra más absoluta prioridad, por lo que implementamos controles físicos y técnicos adecuados y sofisticados, incluidos sistemas de cifrado para la información almacenada y en tránsito, diseñados para impedir el acceso no autorizado o que se divulgue su contenido y para garantizar que nuestro uso cumple con nuestro compromiso con usted. Para obtener más información, consulte https://aws.amazon.com/compliance/data-privacy-faq/.

P: ¿Puedo utilizar Amazon Rekognition en relación con sitios web, programas u otras aplicaciones dirigidos o concebidos para niños menores de 13 años y sujetos a la Ley de protección de la privacidad de los niños en línea (COPPA, por sus siglas en inglés)?

Sí, sujeto al cumplimiento de los Términos de Servicio de Amazon Rekognition, incluyendo su obligación de proporcionar cualquier aviso requerido y obtener cualquier consentimiento verificable de los padres según COPPA, puede usar Amazon Rekognition en relación con sitios web, programas u otras aplicaciones dirigidos o concebidos, en todo o en parte, para niños menores de 13 años.

P: ¿Cómo puedo determinar si mi sitio web, programa o aplicación está sujeto a la ley COPPA?

Para obtener información sobre los requisitos de la ley COPPA y sus directrices para determinar si su sitio web, programa u otra aplicación está sujeto a la ley COPPA, consulte directamente los recursos proporcionados y mantenidos por la Comisión Federal de Comercio de Estados Unidos. Este sitio también contiene información sobre cómo determinar si un servicio está dirigido o concebido, en todo o en parte, para niños menores de 13 años.

P: ¿Amazon Rekognition cumple los requisitos de HIPAA?

Amazon Rekognition es un servicio que cumple los requisitos de HIPAA y que está cubierto bajo el anexo para socios empresariales de AWS (AWS BAA). Si cuenta con un AWS BAA vigente, Amazon Rekognition usará, divulgará y conservará su información sanitaria protegida (PHI) únicamente en la medida que lo permitan los términos de su AWS BAA.

Control de acceso

P: ¿Cómo puedo controlar el acceso de los usuarios a Amazon Rekognition?

Amazon Rekognition se integra con AWS Identity and Access Management (IAM). Se pueden utilizar políticas de AWS IAM para garantizar que solo los usuarios autorizados dispongan de acceso a las API de Amazon Rekognition. Para obtener más información, consulte la página de control del acceso y la autenticación de Amazon Rekognition.

Más información sobre los precios de Amazon Rekognition

Visite la página de precios
¿Listo para crear?
Introducción a AWS Rekognition
¿Tiene más preguntas?
Contacte con nosotros