¿Qué es el aprendizaje profundo en la IA?
El aprendizaje profundo es un método de inteligencia artificial (IA) de que enseña a las computadoras a procesar datos de una manera inspirada en el cerebro humano. Los modelos de aprendizaje profundo son capaces de reconocer imágenes complejas, textos, sonidos y otros patrones de datos, a fin de generar información y predicciones precisas. Es posible utilizar métodos de aprendizaje profundo para automatizar tareas que habitualmente requieren inteligencia humana, como la descripción de imágenes o la transcripción a texto de un archivo de sonido.
¿Qué es el aprendizaje generativo profundo?
El aprendizaje generativo profundo es un aprendizaje profundo que se centra en crear nuevos resultados a partir de los datos aprendidos. Tradicionalmente, el aprendizaje profundo se centraba en identificar las relaciones entre los datos. Los modelos de aprendizaje profundo se entrenaron con grandes cantidades de datos para reconocer patrones en el conjunto de datos.
El aprendizaje generativo profundo agrega generación al reconocimiento de patrones. Estos modelos buscan patrones de datos y luego crean sus propios patrones únicos. Por ejemplo, pueden analizar el texto de varios libros y luego usar la información para generar nuevas oraciones y párrafos que no se encuentran en los libros originales.
El aprendizaje generativo profundo es la base de la IA generativa moderna y de los modelos básicos. Estos modelos utilizan tecnologías de aprendizaje profundo a escala, entrenadas con grandes cantidades de datos, para realizar tareas complejas como responder preguntas, crear imágenes a partir de texto y escribir contenido.
¿Por qué es importante el aprendizaje profundo?
Varias aplicaciones de inteligencia artificial que se utilizan en productos de uso cotidiano se basan en la tecnología de aprendizaje profundo. Estos son algunos ejemplos:
- Chatbots y generadores de código
- Asistentes digitales
- Mandos de televisión activados por voz
- Detección de fraudes
- Reconocimiento facial automático
También es un componente crítico de las tecnologías, como los vehículos autónomos, la realidad virtual, etc. Las empresas utilizan modelos de aprendizaje profundo para analizar datos y realizar predicciones en diversas aplicaciones.
¿Cuáles son los casos prácticos del aprendizaje profundo?
El aprendizaje profundo tiene varios casos de uso en los sectores automotriz, aeroespacial, manufacturero, electrónico y de investigación médica, entre otros.
- Los vehículos autónomos utilizan modelos de aprendizaje profundo para la detección de objetos.
- Los sistemas de defensa utilizan el aprendizaje profundo para identificar y marcar zonas de interés en las imágenes satelitales.
- El aprendizaje profundo se utiliza en el análisis de imágenes médicas para detectar las células cancerosas y realizar un diagnóstico médico.
- Las fábricas utilizan aplicaciones de aprendizaje profundo para detectar si las personas u objetos se encuentran a una distancia insegura de las máquinas.
Estos diversos casos de uso del aprendizaje profundo se pueden agrupar en cinco grandes categorías: visión artificial, reconocimiento del habla, procesamiento de lenguaje natural (NLP), motores de recomendación e IA generativa.
Visión artificial
La visión artificial extrae automáticamente la información y los conocimientos de las imágenes y los videos. Técnicas de aprendizaje profundo para comprender las imágenes de la misma manera que lo hacen los humanos. La visión artificial tiene varias aplicaciones, como las siguientes:
- Moderación de contenido para eliminar de forma automática los contenidos inseguros o inapropiados de los archivos de imágenes y videos
- Reconocimiento facial para identificar rostros y reconocer atributos como ojos abiertos, gafas y vello facial
- La clasificación de imágenes para identificar los logotipos de las marcas, la ropa, el equipo de seguridad y otros detalles de la imagen
Reconocimiento de voz
Los modelos de aprendizaje profundo pueden analizar el habla humana a pesar de que varíen los patrones de habla, el tono, el idioma y el acento. Los asistentes virtuales como Amazon Alexa, texto a voz y software de conversión de voz a texto utilizan el reconocimiento de voz para realizar las siguientes tareas:
- Apoyar a los agentes de los centros de llamadas y clasificar las llamadas de forma automática.
- Convertir las conversaciones clínicas en documentación en tiempo real.
- Subtitular con precisión los videos y las grabaciones de las reuniones para que los contenidos tengan un mayor alcance.
- Convertir los guiones en peticiones para obtener asistencia de voz inteligente.
Procesamiento del lenguaje natural
Las computadoras utilizan algoritmos de aprendizaje profundo para obtener conocimientos y significado de datos textuales y documentos. Esta capacidad de procesar texto natural creado por humanos tiene varios casos prácticos, como en estas funciones:
- Agentes virtuales automatizados y chatbots
- Resumen automático de documentos o artículos de noticias
- Análisis de inteligencia empresarial de documentos largos, como correos electrónicos y formularios
- Indexación de frases clave que indican la opinión, como los comentarios positivos y negativos en las redes sociales
Motores de recomendaciones
Las aplicaciones pueden utilizar métodos de aprendizaje profundo para realizar un seguimiento de la actividad del usuario y desarrollar recomendaciones personalizadas. Pueden analizar el comportamiento de los usuarios y ayudarles a descubrir nuevos productos o servicios. Por ejemplo,
- Recomendar vídeos y contenidos personalizados.
- Recomendar productos y servicios personalizados.
- Filtrar los resultados de búsqueda para resaltar el contenido relevante en función de la ubicación y el comportamiento del usuario
IA generativa
Las aplicaciones de IA generativa pueden crear contenido nuevo y comunicarse con los usuarios finales de forma más sofisticada. Pueden ayudar a automatizar flujos de trabajo complejos, generar ideas y búsquedas inteligentes de conocimiento. Por ejemplo, con herramientas de IA generativa como Amazon Q Business y Amazon Q Developer, los usuarios pueden
- Hacer preguntas en lenguaje natural y obtener respuestas resumidas de varias fuentes de conocimiento internas.
- Recibir sugerencias de código y escaneos y actualizaciones automáticos de código.
- Crear nuevos documentos, correos electrónicos y otro contenido de marketing con mayor rapidez.
¿Cuáles son los componentes de una red de aprendizaje profundo?
A continuación, se indican los componentes de una red neuronal profunda.
Capa de entrada
Una red neuronal artificial tiene varios nodos que introducen datos en esta. Estos nodos constituyen la capa de entrada del sistema.
Capa oculta
La capa de entrada procesa los datos y los transmite a otras capas de la red neuronal. Estas capas ocultas procesan la información a diferentes niveles. Además, adaptan su comportamiento a medida que reciben nueva información. Las redes de aprendizaje profundo tienen cientos de capas ocultas que sirven para analizar un problema desde diferentes puntos de vista.
Por ejemplo, si recibiera una imagen de un animal desconocido que tuviera que clasificar, lo compararía con animales que ya conoce. Por ejemplo, se fijaría en la forma de los ojos y las orejas, en el tamaño, en el número de patas y en el patrón del pelaje. Intentaría identificar patrones, como los siguientes:
- El animal tiene pezuñas, por lo que podría ser una vaca o un venado.
- El animal tiene ojos de gato, por lo que podría ser algún tipo de gato salvaje.
Las capas ocultas de las redes neuronales profundas operan de la misma manera. Si un algoritmo de aprendizaje profundo intenta clasificar la imagen de un animal, cada una de las capas ocultas procesa una característica diferente del animal e intenta categorizarlo con precisión.
Capa de salida
La capa de salida está formada por los nodos que emiten los datos de salida. Los modelos de aprendizaje profundo que arrojan como salida respuestas “sí” o “no” únicamente tienen dos nodos en la capa de salida. Por otro lado, los que arrojan como salida una mayor variedad de respuestas tienen más nodos.
¿Cómo funciona el aprendizaje profundo?
Los modelos de aprendizaje profundo son redes neuronales diseñadas a partir del cerebro humano. Un cerebro humano contiene millones de neuronas interconectadas biológicamente que trabajan juntas para aprender y procesar información. Del mismo modo, las neuronas artificiales son módulos de software llamados nodos que utilizan cálculos matemáticos para procesar datos. Las redes neuronales de aprendizaje profundo, o redes neuronales artificiales, comprenden muchas capas de neuronas artificiales que trabajan juntas para resolver problemas complejos.
A continuación, se indican los componentes de una red neuronal profunda.
Capa de entrada
Una red neuronal artificial tiene varios nodos que introducen datos en esta. Estos nodos forman la capa de entrada del sistema.
Capa oculta
La capa de entrada procesa los datos y los transmite a otras capas de la red neuronal. Estas capas ocultas procesan la información a diferentes niveles. Además, adaptan su comportamiento a medida que reciben nueva información. Las redes de aprendizaje profundo tienen cientos de capas ocultas que sirven para analizar un problema desde diferentes puntos de vista.
Por ejemplo, si recibiera una imagen de un animal desconocido que tuviera que clasificar, lo compararía con animales que ya conoce. Por ejemplo, observaría la forma de sus ojos y orejas, el tamaño, el número de patas y el patrón de pelaje. Intentaría identificar patrones, como los siguientes:
- El animal tiene pezuñas, por lo que podría ser una vaca o un venado.
- El animal tiene ojos de gato, por lo que podría ser un gato salvaje.
Las capas ocultas de las redes neuronales profundas operan de la misma manera. Si un algoritmo de aprendizaje profundo intenta clasificar la imagen de un animal, cada una de sus capas ocultas procesa una característica animal diferente e intenta clasificarla con precisión.
Capa de salida
La capa de salida está formada por los nodos que emiten los datos de salida. Los modelos de aprendizaje profundo que arrojan como salida respuestas “sí” o “no” únicamente tienen dos nodos en la capa de salida. Por otro lado, los que arrojan como salida una mayor variedad de respuestas tienen más nodos. La IA generativa tiene una capa de salida sofisticada para generar nuevos datos que coincidan con los patrones de su conjunto de datos de entrenamiento.
¿Cuál es la diferencia entre el machine learning, el aprendizaje profundo y la IA generativa?
Los términos machine learning, aprendizaje profundo e IA generativa indican una progresión en la tecnología de redes neuronales.
Machine learning
El aprendizaje profundo es un subconjunto del machine learning. Los algoritmos de aprendizaje profundo surgieron al aumentar la eficacia de las técnicas tradicionales de machine learning. Bajo los métodos tradicionales de machine learning, se requiere un importante esfuerzo humano para entrenar el software. Por ejemplo, en el reconocimiento de imágenes de animales, es necesario hacer lo siguiente:
- Etiquetar manualmente cientos de miles de imágenes de animales.
- Hacer que los algoritmos de machine learning procesen esas imágenes.
- Probar esos algoritmos en un conjunto de imágenes desconocidas.
- Identificar las razones por las que algunos resultados son inexactos.
- Mejorar el conjunto de datos mediante el etiquetado de nuevas imágenes para mejorar la precisión de los resultados.
Este proceso se denomina aprendizaje supervisado. En el aprendizaje supervisado, la precisión de los resultados solo mejora con un conjunto de datos amplio y suficientemente variado. Por ejemplo, es posible que el algoritmo identifique con precisión a los gatos negros pero no a los blancos debido a que el conjunto de datos de entrenamiento tenía más imágenes de gatos negros. En ese caso, necesitaría más datos etiquetados de imágenes de gatos blancos y entrenar de nuevo los modelos de machine learning.
Ventajas del aprendizaje profundo frente al machine learning
Una red de aprendizaje profundo tiene las siguientes ventajas con respecto al machine learning tradicional.
Procesamiento eficiente de datos no estructurados
Para los métodos de machine learning, los datos no estructurados, como los documentos de texto, son difíciles de procesar porque el conjunto de datos de entrenamiento puede tener infinitas variaciones. En cambio, los modelos de aprendizaje profundo son capaces de comprender los datos no estructurados y hacer observaciones generales sin necesidad de extraer manualmente las características. Por ejemplo, una red neuronal puede reconocer que estas dos frases de entrada diferentes tienen el mismo significado:
- ¿Puede explicarme cómo hacer el pago?
- ¿Cómo puedo transferir dinero?
Relaciones ocultas y detección de patrones
Una aplicación de aprendizaje profundo puede analizar grandes cantidades de datos con mayor profundidad y revelar nueva información sobre la cual podría no haber sido entrenada. Por ejemplo, considere un modelo de aprendizaje profundo entrenado para analizar las compras realizadas por los consumidores. El modelo únicamente tiene datos sobre los artículos que ya se han comprado. Sin embargo, la red neuronal artificial puede sugerir nuevos artículos que aún no se han comprado al comparar los patrones de compra con los de clientes similares.
Aprendizaje no supervisado
Los modelos de aprendizaje profundo son capaces de aprender y mejorar a lo largo del tiempo en función del comportamiento del usuario. No requieren grandes variaciones de conjuntos de datos etiquetados. Por ejemplo, consideremos una red neuronal que corrija o sugiera palabras de forma automática mediante el análisis de su comportamiento de escritura. Supongamos que se entrenó en inglés y que es posible corregir la ortografía de las palabras en inglés. Sin embargo, si escribe con frecuencia palabras que no están en inglés, como danke, la red neuronal aprende automáticamente y las incluye en la función de autocorrección.
Procesamiento de datos volátiles
Los conjuntos de datos volátiles tienen grandes variaciones. Un ejemplo son los importes de los pagos de los préstamos en un banco. Una red neuronal de aprendizaje profundo también puede categorizar y ordenar esos datos al analizar las transacciones financieras e identificar y marcar algunas para detectar fraudes.
Obtenga más información sobre el aprendizaje profundo y el machine learning
IA generativa
La IA generativa llevó las redes neuronales del machine learning y el aprendizaje profundo al siguiente nivel. Mientras que el machine learning y el aprendizaje profundo se centran en la predicción y el reconocimiento de patrones, la IA generativa produce resultados únicos en función de los patrones que detecta. La tecnología de IA generativa se basa en la arquitectura transformadora, que combina varias redes neuronales diferentes para combinar patrones de datos de formas únicas. Las redes de aprendizaje profundo primero convierten el texto, las imágenes y otros datos en abstracciones matemáticas y, después, los reconvierten en nuevos patrones significativos.
¿Qué es el aprendizaje profundo en el contexto del machine learning?
El aprendizaje profundo es un subconjunto del machine learning. Los algoritmos de aprendizaje profundo surgieron ante la intención de aumentar la eficacia de las técnicas tradicionales de machine learning. Bajo los métodos tradicionales de machine learning, se requiere un importante esfuerzo humano para entrenar el software. Por ejemplo, en el reconocimiento de imágenes de animales, es necesario hacer lo siguiente:
- Etiquetar manualmente cientos de miles de imágenes de animales.
- Hacer que los algoritmos de machine learning procesen esas imágenes.
- Probar esos algoritmos en un conjunto de imágenes desconocidas.
- Identificar las razones por las que algunos resultados son inexactos.
- Mejorar el conjunto de datos mediante el etiquetado de nuevas imágenes para mejorar la precisión de los resultados.
Este proceso se denomina aprendizaje supervisado. En el aprendizaje supervisado, la precisión de los resultados únicamente mejora al disponer de un conjunto de datos amplio y suficientemente variado. Por ejemplo, es posible que el algoritmo identifique con precisión a los gatos negros pero no a los blancos debido a que el conjunto de datos de entrenamiento tenía más imágenes de gatos negros. En ese caso, sería necesario etiquetar más imágenes de gatos blancos y entrenar de nuevo los modelos de machine learning.
¿Cuáles son las ventajas del aprendizaje profundo frente al machine learning?
Una red de aprendizaje profundo tiene las siguientes ventajas con respecto al machine learning tradicional.
Procesamiento eficiente de datos no estructurados
Para los métodos de machine learning, los datos no estructurados, como los documentos de texto, son difíciles de procesar porque el conjunto de datos de entrenamiento puede tener infinitas variaciones. En cambio, los modelos de aprendizaje profundo son capaces de comprender los datos no estructurados y hacer observaciones generales sin necesidad de extraer manualmente las características. Por ejemplo, una red neuronal puede reconocer que estas dos frases de entrada diferentes tienen el mismo significado:
- ¿Puede explicarme cómo hacer el pago?
- ¿Cómo puedo transferir dinero?
Relaciones ocultas y detección de patrones
Una aplicación de aprendizaje profundo puede analizar grandes cantidades de datos con mayor profundidad y revelar nueva información sobre la cual podría no haber sido entrenada. Por ejemplo, considere un modelo de aprendizaje profundo entrenado para analizar las compras realizadas por los consumidores. El modelo únicamente tiene datos sobre los artículos que ya se han comprado. Sin embargo, la red neuronal artificial puede sugerir nuevos artículos que aún no se han comprado al comparar los patrones de compra con los de otros clientes similares.
Aprendizaje no supervisado
Los modelos de aprendizaje profundo son capaces de aprender y mejorar a lo largo del tiempo en función del comportamiento del usuario. No requieren grandes variaciones de conjuntos de datos etiquetados. Por ejemplo, consideremos una red neuronal que corrija o sugiera palabras de forma automática mediante el análisis de su comportamiento de escritura. Supongamos que se entrenó en el idioma inglés y que es posible corregir la ortografía de las palabras en inglés. Sin embargo, si escribe con frecuencia palabras que no están en inglés, como danke, la red neuronal aprende automáticamente y las incluye en la función de autocorrección.
Procesamiento de datos volátiles
Los conjuntos de datos volátiles tienen grandes variaciones. Un ejemplo son los importes de los pagos de los préstamos en un banco. Una red neuronal de aprendizaje profundo también puede categorizar y ordenar esos datos, por ejemplo, al analizar las transacciones financieras e identificar y marcar algunas de estas para detectar fraudes.
¿Cuáles son los desafíos que plantea el aprendizaje profundo?
Los desafíos en la implementación del aprendizaje profundo y la IA generativa se detallan a continuación.
Grandes cantidades de datos de alta calidad
Cuando los entrena con grandes cantidades de datos de alta calidad, los algoritmos de aprendizaje profundo ofrecen mejores resultados. Los valores atípicos o los errores en el conjunto de datos de entrada pueden repercutir significativamente en el proceso de aprendizaje profundo. Por ejemplo, en nuestro ejemplo de imágenes de animales, el modelo de aprendizaje profundo podría clasificar un avión como tortuga si el conjunto de datos introduce accidentalmente imágenes que no son de animales.
Para evitar estas imprecisiones, es necesario limpiar y procesar grandes cantidades de datos antes de entrenar los modelos de aprendizaje profundo. El procesamiento previo de los datos de entrada requiere una gran capacidad de almacenamiento de datos.
Gran potencia de procesamiento
Los algoritmos de aprendizaje profundo requieren un uso intensivo de la computación y una infraestructura con suficiente capacidad de computación para funcionar correctamente. De otro modo, tardan mucho en procesar los resultados.
¿Cuáles son los beneficios de la IA generativa y el aprendizaje profundo en la nube?
La ejecución de la IA generativa y el aprendizaje profundo en la infraestructura en la nube ayuda a diseñar, desarrollar y entrenar aplicaciones con mayor rapidez.
Velocidad
Es posible entrenar modelos de IA generativa y aprendizaje profundo con mayor rapidez mediante el uso de clústeres de GPU y CPU para realizar las complejas operaciones matemáticas que requieren las redes neuronales. A continuación, se pueden desplegar estos modelos para procesar grandes cantidades de datos y producir resultados cada vez más relevantes.
Escalabilidad
Gracias a la amplia gama de recursos bajo demanda disponibles a través de la nube, se puede acceder a recursos de hardware prácticamente ilimitados para abordar modelos de aprendizaje profundo de IA de cualquier tamaño. Las redes neuronales pueden recurrir a varios procesadores para distribuir sin problemas y de forma eficaz las cargas de trabajo entre distintos tipos y cantidades de procesadores.
Herramientas
Puede acceder a herramientas de IA y aprendizaje profundo, como cuadernos, depuradores, generadores de perfiles, canalizaciones, AIOps y más. Puede trabajar con los modelos de IA generativa existentes desde la nube como un servicio sin necesidad de infraestructura para alojar el modelo. Los equipos pueden empezar con aplicaciones de IA generativa y aprendizaje profundo, incluso con conocimientos y formación limitados.
¿Cómo puede ayudar AWS con sus requisitos de IA generativa y aprendizaje profundo?
Los servicios de IA y aprendizaje profundo de AWS aprovechan el poder de la computación en la nube para que pueda construir y escalar la próxima ola de innovación en IA. Reinvente las experiencias de los clientes con los servicios diseñados específicamente más completos, la infraestructura de inteligencia artificial, la tecnología de aprendizaje profundo y las soluciones de IA generativa más completos. Por ejemplo,
- Amazon SageMaker proporciona infraestructuras, herramientas y flujos de trabajo totalmente administrados para el desarrollo del aprendizaje profundo y el machine learning.
- Amazon Bedrock proporciona una API única para acceder y utilizar varios modelos básicos de alto rendimiento de las principales empresas de IA.
También puede utilizar la infraestructura de IA de AWS para acceder a una informática, un almacenamiento y una red completos, seguros y con una buena relación calidad-precio para crear cualquier aplicación de IA. Comience con el aprendizaje profundo de la IA en AWS en ¡y cree una cuenta de AWS gratuita hoy mismo!
Siguientes pasos para el aprendizaje profundo en AWS
Obtenga acceso inmediato al nivel Gratuito de AWS.
Comience a crear en la consola de administración de AWS.