¿Qué es el aprendizaje profundo?
El aprendizaje profundo es un método de la inteligencia artificial (IA) que entrena a las computadoras para procesar datos de una manera que se inspira en el cerebro humano. Los modelos de aprendizaje profundo son capaces de reconocer patrones complejos en imágenes, textos, sonidos y otros datos, a fin de generar información y predicciones precisas. Es posible utilizar métodos de aprendizaje profundo para automatizar tareas que habitualmente requieren inteligencia humana, como la descripción de imágenes o la transcripción a texto de un archivo de sonido.
¿Por qué es importante el aprendizaje profundo?
La inteligencia artificial (IA) intenta entrenar a las computadoras de modo que piensen y aprendan como lo hacen los humanos. Varias aplicaciones de IA que se utilizan en productos de uso cotidiano se basan en la tecnología de aprendizaje profundo. Estos son algunos ejemplos:
- Asistentes digitales
- Mandos de televisión activados por voz
- Detección de fraudes
- Reconocimiento facial automático
También es un componente crítico de las tecnologías emergentes, como los vehículos autónomos, la realidad virtual, etc.
Los modelos de aprendizaje profundo son archivos de computadora que los científicos de datos han entrenado para realizar tareas mediante un algoritmo o un conjunto predefinido de pasos. Las empresas utilizan modelos de aprendizaje profundo para analizar datos y realizar predicciones en diversas aplicaciones.
¿Para qué se utiliza el aprendizaje profundo?
El aprendizaje profundo tiene varios casos de uso en los sectores automotriz, aeroespacial, manufacturero, electrónico y de investigación médica, entre otros. Estos son algunos ejemplos de aprendizaje profundo:
- Los vehículos autónomos utilizan modelos de aprendizaje profundo para detectar automáticamente las señales de tráfico y los peatones.
- Los sistemas de defensa utilizan el aprendizaje profundo para identificar y marcar automáticamente zonas de interés en las imágenes satelitales.
- El aprendizaje profundo se utiliza en el análisis de imágenes médicas para detectar automáticamente las células cancerosas y realizar un diagnóstico médico.
- Las fábricas utilizan aplicaciones de aprendizaje profundo para detectar automáticamente si las personas u objetos se encuentran a una distancia insegura de las máquinas.
Es posible agrupar estos diversos casos de uso del aprendizaje profundo en cuatro grandes categorías: visión artificial, reconocimiento del habla, procesamiento de lenguaje natural (PNL) y motores de recomendación.
Visión artificial
La visión artificial es la capacidad de la computadora para extraer información y conocimientos a partir de imágenes y videos. Las computadoras pueden utilizar técnicas de aprendizaje profundo para comprender las imágenes de la misma manera que lo hacen los humanos. La visión artificial tiene varias aplicaciones, como las siguientes:
- Moderación de contenido para eliminar de forma automática los contenidos inseguros o inapropiados de los archivos de imágenes y videos
- Reconocimiento facial para identificar rostros y reconocer atributos como ojos abiertos, gafas y vello facial
- La clasificación de imágenes para identificar los logotipos de las marcas, la ropa, el equipo de seguridad y otros detalles de la imagen
Reconocimiento de voz
Los modelos de aprendizaje profundo pueden analizar el habla humana a pesar de que varíen los patrones de habla, el tono, el idioma y el acento. Los asistentes virtuales, como Amazon Alexa y el software de transcripción automática, utilizan el reconocimiento de voz para realizar las siguientes tareas:
- Asistir a los agentes de los centros de llamadas y clasificar las llamadas de forma automática
- Convertir las conversaciones clínicas en documentación en tiempo real.
- Subtitular con precisión los videos y las grabaciones de las reuniones para que los contenidos tengan un mayor alcance.
Procesamiento del lenguaje natural
Las computadoras utilizan algoritmos de aprendizaje profundo para obtener información y significado a partir de datos de texto y documentos. Esta capacidad de procesar texto natural creado por humanos tiene varios casos de uso, como en estas funciones:
- Chatbots y agentes virtuales automatizados
- Resumen automático de documentos o artículos de noticias
- Análisis de inteligencia empresarial de documentos largos, como correos electrónicos y formularios
- Indexación de frases clave que indican la opinión, como los comentarios positivos y negativos en las redes sociales
Motores de recomendaciones
Las aplicaciones pueden utilizar métodos de aprendizaje profundo para realizar un seguimiento de la actividad del usuario y desarrollar recomendaciones personalizadas. Pueden analizar el comportamiento de varios usuarios y ayudarles a descubrir nuevos productos o servicios. Por ejemplo, muchas empresas de contenido multimedia y entretenimiento, como Netflix, Fox y Peacock, utilizan el aprendizaje profundo para ofrecer recomendaciones de video personalizadas.
¿Cómo funciona el aprendizaje profundo?
Los algoritmos de aprendizaje profundo son redes neuronales que se modelan a partir del cerebro humano. Por ejemplo, un cerebro humano contiene millones de neuronas interconectadas que trabajan juntas para aprender y procesar información. Del mismo modo, las redes neuronales de aprendizaje profundo, o redes neuronales artificiales, están formadas por numerosas capas de neuronas artificiales que trabajan juntas dentro de la computadora.
Las neuronas artificiales son módulos de software llamados nodos, que utilizan cálculos matemáticos para procesar los datos. Las redes neuronales artificiales son algoritmos de aprendizaje profundo que utilizan estos nodos para resolver problemas complejos.
¿Cuáles son los componentes de una red de aprendizaje profundo?
A continuación, se indican los componentes de una red neuronal profunda.
Capa de entrada
Una red neuronal artificial tiene varios nodos que introducen datos en esta. Estos nodos constituyen la capa de entrada del sistema.
Capa oculta
La capa de entrada procesa los datos y los transmite a otras capas de la red neuronal. Estas capas ocultas procesan la información a diferentes niveles. Además, adaptan su comportamiento a medida que reciben nueva información. Las redes de aprendizaje profundo tienen cientos de capas ocultas que sirven para analizar un problema desde diferentes puntos de vista.
Por ejemplo, si recibiera una imagen de un animal desconocido que tuviera que clasificar, lo compararía con animales que ya conoce. Por ejemplo, se fijaría en la forma de los ojos y las orejas, en el tamaño, en el número de patas y en el patrón del pelaje. Intentaría identificar patrones, como los siguientes:
- El animal tiene pezuñas, por lo que podría ser una vaca o un venado.
- El animal tiene ojos de gato, por lo que podría ser algún tipo de gato salvaje.
Las capas ocultas de las redes neuronales profundas operan de la misma manera. Si un algoritmo de aprendizaje profundo intenta clasificar la imagen de un animal, cada una de las capas ocultas procesa una característica diferente del animal e intenta categorizarlo con precisión.
Capa de salida
La capa de salida está formada por los nodos que emiten los datos de salida. Los modelos de aprendizaje profundo que arrojan como salida respuestas “sí” o “no” únicamente tienen dos nodos en la capa de salida. Por otro lado, los que arrojan como salida una mayor variedad de respuestas tienen más nodos.
¿Qué es el aprendizaje profundo en el contexto del machine learning?
El aprendizaje profundo es un subconjunto del machine learning. Los algoritmos de aprendizaje profundo surgieron ante la intención de aumentar la eficacia de las técnicas tradicionales de machine learning. Bajo los métodos tradicionales de machine learning, se requiere un importante esfuerzo humano para entrenar el software. Por ejemplo, en el reconocimiento de imágenes de animales, es necesario hacer lo siguiente:
- Etiquetar manualmente cientos de miles de imágenes de animales.
- Hacer que los algoritmos de machine learning procesen esas imágenes.
- Probar esos algoritmos en un conjunto de imágenes desconocidas.
- Identificar las razones por las que algunos resultados son inexactos.
- Mejorar el conjunto de datos mediante el etiquetado de nuevas imágenes para mejorar la precisión de los resultados.
Este proceso se denomina aprendizaje supervisado. En el aprendizaje supervisado, la precisión de los resultados únicamente mejora al disponer de un conjunto de datos amplio y suficientemente variado. Por ejemplo, es posible que el algoritmo identifique con precisión a los gatos negros pero no a los blancos debido a que el conjunto de datos de entrenamiento tenía más imágenes de gatos negros. En ese caso, sería necesario etiquetar más imágenes de gatos blancos y entrenar de nuevo los modelos de machine learning.
¿Cuáles son las ventajas del aprendizaje profundo frente al machine learning?
Una red de aprendizaje profundo tiene las siguientes ventajas con respecto al machine learning tradicional.
Procesamiento eficiente de datos no estructurados
Para los métodos de machine learning, los datos no estructurados, como los documentos de texto, son difíciles de procesar porque el conjunto de datos de entrenamiento puede tener infinitas variaciones. En cambio, los modelos de aprendizaje profundo son capaces de comprender los datos no estructurados y hacer observaciones generales sin necesidad de extraer manualmente las características. Por ejemplo, una red neuronal puede reconocer que estas dos frases de entrada diferentes tienen el mismo significado:
- ¿Puede explicarme cómo hacer el pago?
- ¿Cómo puedo transferir dinero?
Relaciones ocultas y detección de patrones
Una aplicación de aprendizaje profundo puede analizar grandes cantidades de datos con mayor profundidad y revelar nueva información sobre la cual podría no haber sido entrenada. Por ejemplo, considere un modelo de aprendizaje profundo entrenado para analizar las compras realizadas por los consumidores. El modelo únicamente tiene datos sobre los artículos que ya se han comprado. Sin embargo, la red neuronal artificial puede sugerir nuevos artículos que aún no se han comprado al comparar los patrones de compra con los de otros clientes similares.
Aprendizaje no supervisado
Los modelos de aprendizaje profundo son capaces de aprender y mejorar a lo largo del tiempo en función del comportamiento del usuario. No requieren grandes variaciones de conjuntos de datos etiquetados. Por ejemplo, consideremos una red neuronal que corrija o sugiera palabras de forma automática mediante el análisis de su comportamiento de escritura. Supongamos que se entrenó en el idioma inglés y que es posible corregir la ortografía de las palabras en inglés. Sin embargo, si escribe con frecuencia palabras que no están en inglés, como danke, la red neuronal aprende automáticamente y las incluye en la función de autocorrección.
Procesamiento de datos volátiles
Los conjuntos de datos volátiles tienen grandes variaciones. Un ejemplo son los importes de los pagos de los préstamos en un banco. Una red neuronal de aprendizaje profundo también puede categorizar y ordenar esos datos, por ejemplo, al analizar las transacciones financieras e identificar y marcar algunas de estas para detectar fraudes.
¿Cuáles son los desafíos que plantea el aprendizaje profundo?
Dado que el aprendizaje profundo es una tecnología relativamente nueva, surgen ciertos retos a la hora de aplicarla de forma práctica.
Grandes cantidades de datos de alta calidad
Los algoritmos de aprendizaje profundo arrojan mejores resultados cuando se entrenan con grandes cantidades de datos de alta calidad. Los valores atípicos o los errores en el conjunto de datos de entrada pueden repercutir significativamente en el proceso de aprendizaje profundo. Por ejemplo, en nuestro ejemplo de imágenes de animales, el modelo de aprendizaje profundo podría clasificar un avión como una tortuga si se introdujeran accidentalmente imágenes distintas a las de animales en el conjunto de datos.
Para evitar estas imprecisiones, es necesario limpiar y procesar grandes cantidades de datos antes de entrenar los modelos de aprendizaje profundo. El procesamiento previo de los datos de entrada requiere una gran capacidad de almacenamiento de datos.
Gran potencia de procesamiento
Los algoritmos de aprendizaje profundo requieren un uso intensivo de la computación y una infraestructura con suficiente capacidad de computación para funcionar correctamente. De otro modo, tardan mucho en procesar los resultados.
¿Cuáles son los beneficios del aprendizaje profundo en la nube?
Al ejecutar algoritmos de aprendizaje profundo en la infraestructura en la nube se pueden superar varios de estos desafíos. El aprendizaje profundo en la nube se puede utilizar para diseñar, desarrollar y entrenar aplicaciones de aprendizaje profundo con mayor rapidez.
Velocidad
Es posible entrenar modelos de aprendizaje profundo con mayor rapidez mediante el uso de clústeres de GPU y CPU para realizar las complejas operaciones matemáticas que requieren las redes neuronales. A continuación, se pueden desplegar estos modelos para procesar grandes cantidades de datos y producir resultados cada vez más relevantes.
Escalabilidad
Gracias a la amplia gama de recursos bajo demanda disponibles a través de la nube, se puede acceder a recursos de hardware prácticamente ilimitados para abordar modelos de aprendizaje profundo de cualquier tamaño. Las redes neuronales pueden recurrir a varios procesadores para distribuir sin problemas y de forma eficaz las cargas de trabajo entre distintos tipos y cantidades de procesadores.
¿Qué es el aprendizaje profundo en AWS?
Los servicios de aprendizaje profundo de AWS aprovechan la potencia de la computación en la nube de modo que sea posible escalar las redes neuronales de aprendizaje profundo a un costo menor, así como optimizarlas para que sean más rápidas. También puede utilizar los servicios de AWS, como los siguientes, para administrar completamente aplicaciones específicas de aprendizaje profundo:
- Amazon Rekognition para agregar características de visión artificial entrenadas previamente o personalizables a la aplicación.
- Amazon Transcribe para reconocer automáticamente y transcribir con precisión el habla
- Amazon Lex para crear chatbots inteligentes que comprendan la intención, mantengan el contexto conversacional y automaticen tareas simples en muchos idiomas.
Comience a utilizar el aprendizaje profundo en AWS con Amazon SageMaker para crear, entrenar y desplegar redes neuronales a escala de forma rápida y sencilla. También puede utilizar las AMI de aprendizaje profundo de AWS para crear entornos y flujos de trabajo personalizados para el aprendizaje profundo. Cree una cuenta de AWS gratuita para comenzar hoy mismo.
Siguientes pasos para el aprendizaje profundo en AWS
Obtenga acceso inmediato al nivel Gratuito de AWS.
Comience a crear en la consola de administración de AWS.