Datos sobre el reconocimiento facial mediante inteligencia artificial
Amazon Rekognition facilita la incorporación del análisis de imágenes y vídeos a sus aplicaciones. Como es el caso con numerosos avances tecnológicos, es importante saber lo que es verdad y lo que no, y cómo se pueden usar. Veamos algunas de las preguntas más frecuentes.
¿Qué es el reconocimiento facial?
El reconocimiento facial es un sistema creado para identificar a una persona a partir de una imagen o vídeo. Esta tecnología ha existido durante décadas, pero su uso se ha vuelto más notable y accesible en los últimos años, ya que ahora se utiliza con soluciones innovadoras, como aplicaciones de fotos personales y autenticación secundaria en dispositivos móviles. Para comprender estas capacidades novedosas, hablemos primero de cómo funciona el reconocimiento facial.
Las capacidades de reconocimiento facial, como las disponibles en Amazon Rekognition, permiten a los usuarios entender cuándo aparecen rostros en una imagen o en un video, así como los atributos de dichos rostros. Por ejemplo, Amazon Rekognition puede analizar atributos como si los ojos están abiertos o cerrados, el estado de ánimo y el color del cabello. Estos atributos detectados son cada vez más útiles para clientes que necesitan organizar millones de imágenes, o realizar búsquedas en ellas, en cuestión de segundos mediante etiquetas de metadatos (p. ej., feliz, gafas, rango de edad) o para identificar a una persona (es decir, reconocimiento facial mediante una imagen de origen o un identificador único).
¿Cómo usan el reconocimiento facial los clientes?
El reconocimiento facial resulta útil en numerosas aplicaciones e industrias. Hoy en día, esta tecnología ayuda a identificar a famosos en su cobertura de eventos significativos de organizaciones de noticias, a proporcionar autenticación secundaria en dispositivos móviles, a indizar automáticamente archivos de imágenes y vídeos para empresas de medios y entretenimiento, e incluso a permitir que los organismos de ayuda humanitaria identifiquen y rescaten a víctimas de la trata de personas.
Marinus Analytics, por ejemplo, utiliza la inteligencia artificial con Amazon Rekognition para proporcionar a las agencias herramientas como Traffic Jam, que les ayudan a identificar y localizar a víctimas de la trata de personas. Los investigadores ahorran valioso tiempo al usar el análisis de imágenes para realizar búsquedas automáticas en millones de registros en cuestión de segundos, algo que anteriormente requería el análisis individual por parte de los investigadores.
Otro ejemplo es Aella Credit, una compañía de servicios financieros con sede en África occidental que proporciona servicios de banca mediante una aplicación móvil para personas con acceso limitado a servicios bancarios en mercados emergentes. Gracias a la capacidad de Amazon Rekognition de detectar y comparar rostros, Aella Credit puede proporcionar identificación sin intervención humana. El sencillo uso del reconocimiento facial permite que más personas que nunca tengan acceso a servicios bancarios. Aquí puede encontrar más ejemplos de clientes que utilizan Amazon Rekognition: clientes de Amazon Rekognition.
¿Cómo debería utilizar el reconocimiento facial de manera responsable?
El reconocimiento facial no debería usarse de manera que quebrante los derechos de una persona, incluido el derecho a la privacidad, o de manera que tome decisiones autónomas que requieran el análisis de una persona. Por ejemplo, cuando un banco utiliza herramientas como Amazon Rekognition en una aplicación financiera para verificar la identidad de sus clientes, el banco siempre debería divulgar claramente su uso de la tecnología y solicitar la aprobación de los clientes en los términos y condiciones. En cuanto a la seguridad pública y el cumplimiento de la ley, creemos que los gobiernos pueden colaborar con las fuerzas del orden para desarrollar políticas de uso de tecnologías de reconocimiento facial aceptables que proteja los derechos de los ciudadanos y permita a las autoridades proteger la seguridad pública.
En todas las situaciones de seguridad pública y cumplimiento de la ley, la tecnología como Amazon Rekognition solo debería utilizarse para reducir los posibles resultados. Las respuestas de Amazon Rekognition permiten a los oficiales obtener un conjunto de rostros de manera rápida para su posterior análisis por personas. Dada la gravedad de los casos de uso de seguridad pública, es necesario complementar el reconocimiento facial con una evaluación realizada por personas. El software de reconocimiento facial no debería usarse de manera autónoma.
Como explica el Dr. Matt Wood, “El aprendizaje automático es una herramienta muy valiosa para ayudar a las fuerzas del orden y, aunque debemos preocuparnos de que se utilice bien, no deberíamos tirar el horno porque se pueda configurar la temperatura equivocada y se pueda quemar la pizza. Sin embargo, es muy razonable que el gobierno tenga en cuenta los distintos aspectos y especifique qué temperatura (o niveles de confianza) desea que las fuerzas del orden alcancen para ayudar en las labores de seguridad pública”.
¿Cómo funciona el reconocimiento facial en Amazon Rekognition?
El reconocimiento facial de Rekognition se crea mediante tecnologías de visión artificial y ML. Funciona de la siguiente manera: (1) ubica la parte de una imagen de entrada que contiene el rostro. (2) Extrae la región de la imagen que contiene la cabeza y alinea la región para que la cara esté en una posición vertical “normal”, de manera que genere imágenes faciales recortadas. (3) Convierte cada imagen facial recortada en un “vector facial” (técnicamente, una representación matemática de la imagen de un rostro). Tenga en cuenta que las colecciones que busca SearchFaces son conjuntos de vectores de rostros, no conjuntos de imágenes de rostros. (4) Compara los vectores faciales de origen y destino y devuelve la puntuación de similitud del sistema para los vectores faciales. Consulte la documentación para desarrolladores para obtener más información sobre las llamadas a la API.
¿Qué son la puntuación de similitud y el umbral de similitud?
Una puntuación de similitud es una medida estadística de la probabilidad de que dos rostros de una imagen pertenezcan a la misma persona cuando se analizan con Amazon Rekognition. Por ejemplo, una imagen con una puntuación de similitud del 95% indicaría que de entre todos los rostros que Rekognition ha analizado, esta imagen tiene una similitud del 95 % con la imagen de la que se ha realizado la búsqueda. Cuanto más alta la puntuación de similitud, significa que es más probable que dos imágenes sean de la misma persona. Dicho eso, una similitud de incluso el 99% no garantiza que sea una coincidencia positiva.
Rekognition utiliza un sistema de probabilidades, en el que no se pueden realizar determinaciones con precisión absoluta. En vez, se trata de una predicción.
Aquí es donde el umbral de similitud entra en juego. El umbral de similitud es la puntuación de similitud más baja que la aplicación que utiliza Rekognition está dispuesta a aceptar como posible coincidencia. El umbral que se elija afecta fundamentalmente los resultados que se obtienen en la búsqueda. La cantidad de identificaciones erróneas (a veces denominadas positivos falsos) que es cliente puede permitirse es un resultado directo de la configuración del umbral. El cliente seleccionará la configuración adecuada en función de sus necesidades y caso de uso de la aplicación.
Recomendamos una configuración del umbral del 99% para casos de uso en los que es importante obtener una similitud de gran precisión. Por ejemplo, en situaciones de seguridad pública y cumplimiento de la ley suele ser un primer paso fundamental para ayudar a reducir los posibles resultados y permitir que las personas evalúen y consideren cuidadosamente las opciones aplicando su juicio.
Por otro lado, muchas situaciones no requieren la evaluación de las respuestas de Amazon Rekognition por parte de personas. Por ejemplo, la autenticación de factor secundaria con una placa de empleado y un rostro reconocido por Amazon Rekognition con una similitud elevada (99%). O una aplicación de álbum de fotos personal, en la que se pueden tolerar unas cuantas coincidencias erróneas, puede ser aceptable un umbral inferior del 80^%. Los clientes pueden configurar el umbral de similitud en función de las características específicas de su caso de uso y de sus necesidades.
¿Qué es la API de reconocimiento de famosos? ¿Es igual o diferente a una búsqueda de rostros?
La detección de famosos está diseñada para identificar a posibles famosos en distintos entornos y escenas de películas. Como los famosos suelen interpretar a diferentes personajes (cambiando su apariencia mediante el maquillaje, pelucas y otras técnicas), esta característica de Amazon Rekognition ha sido entrenada con datos pre-etiquetados para encontrar la mayor cantidad posible de coincidencias con una lista específica de famosos. Por diseño, este caso de uso permite encontrar una cantidad mayor de positivos falsos y no debería utilizarse en casos de uso de seguridad pública o cumplimiento de la ley.
Por contraste, la característica de búsqueda de rostros de Rekognition está diseñada para decir el nivel preciso de similitud entre dos rostros y se puede optimizar para coincidencias precisas y utilizar en aplicaciones de seguridad pública, como encontrar a niños que se han perdido y llevarlos de vuelta a sus padres, autorizar el acceso de los empleados a un edificio o identificar y rescatar a las víctimas de la trata de personas.
Estas dos características son completamente distintas en cuanto a la tecnología subyacente que utilizan, los casos de uso que resuelven y los clientes a los que ayudan.
¿Es seguro el reconocimiento facial?
Sí. Veamos algunas de las ideas equivocadas más comunes en torno al reconocimiento facial y su funcionamiento.
En primer lugar, hay quien cree que las personas pueden comparar los rostros con las imágenes mejor que las máquinas. Sin embargo, el Instituto Nacional de Estándares y Tecnología (NIST) compartió recientemente un estudio de tecnologías de reconocimiento facial que están al menos dos años por detrás de los modelos que utiliza Amazon Rekognition y llegó a la conclusión de que incluso las tecnologías más antiguas eran capaces de sobrepasar a las personas en el reconocimiento facial.
En segundo lugar, como en todos los sistemas de probabilidades, la mera existencia de positivos falsos no significa que el reconocimiento facial sea defectuoso. En vez, subraya la necesidad de seguir las prácticas recomendadas, como la configuración de un umbral de similitud razonable que se corresponda con el caso de uso. Además, una de las ventajas de esta tecnología es que aprende y mejora constantemente, así que los positivos falsos pueden reducirse a lo largo del tiempo.
Hoy en día, numerosos clietnes de éxito, como Thorn, VidMob, Marinus Analytics y POPSUGAR, utilizan el reconocimiento facial de maneras sencillas que logran resultados importantes.
¿Cómo puedo comenzar con el reconocimiento facial?
AWS proporciona tutoriales de 10 minutos y documentación en profundidad con orientaciones prescriptivas para ayudarle a comenzar a usar el reconocimiento facial.
¿Cómo puedo informar sobre abuso potencial de Amazon Rekognition?
Si sospecha que Amazon Rekognition se está utilizando de manera abusiva o ilegal, o que infringe sus derechos o los derechos de otros, informe este uso y AWS investigará el caso.
Obtenga más información sobre Amazon Rekognition