¿Qué es el aprendizaje profundo?

¿Qué es el aprendizaje profundo en la IA?

El aprendizaje profundo es un método de inteligencia artificial (IA) que enseña a las computadoras a procesar datos de una manera que se inspira en el cerebro humano. Los modelos de aprendizaje profundo pueden reconocer imágenes complejas, textos, sonidos y otros patrones de datos, a fin de generar información y predicciones precisas. Es posible utilizar métodos de aprendizaje profundo para automatizar tareas que habitualmente requieren inteligencia humana, como la descripción de imágenes o la transcripción a texto de un archivo de sonido.

Vea nuestra introducción al aprendizaje profundo

¿Qué es el aprendizaje generativo profundo?

El aprendizaje generativo profundo es un aprendizaje profundo que se centra en crear nuevos resultados a partir de los datos aprendidos. Tradicionalmente, el aprendizaje profundo se centraba en identificar las relaciones entre los datos. Los modelos de aprendizaje profundo se entrenaron con grandes cantidades de datos para reconocer patrones en el conjunto de datos.

El aprendizaje generativo profundo agrega generación al reconocimiento de patrones. Estos modelos buscan patrones de datos y luego crean sus propios patrones únicos. Por ejemplo, pueden analizar el texto de varios libros y luego usar la información para generar nuevas oraciones y párrafos que no se encuentran en los libros originales.

El aprendizaje generativo profundo es la base de la IA generativa y los modelos fundaciones modernos. Estos modelos utilizan tecnologías de aprendizaje profundo a escala, entrenadas con grandes cantidades de datos, para llevar a cabo tareas complejas como responder preguntas, crear imágenes a partir de texto y escribir contenido.

Vea un video de introducción a los modelos fundacionales

¿Por qué es importante el aprendizaje profundo?

Varias aplicaciones de inteligencia artificial que se utilizan en productos de uso cotidiano se basan en la tecnología de aprendizaje profundo. Estos son algunos ejemplos:

Chatbots y generadores de código
Asistentes digitales
Mandos de televisión activados por voz
Detección de fraudes
Reconocimiento facial automático

También es un componente crítico de las tecnologías, como los vehículos autónomos, la realidad virtual, etc. Las empresas utilizan modelos de aprendizaje profundo para analizar datos y llevar a cabo predicciones en diversas aplicaciones.

¿Cuáles son los casos de uso del aprendizaje profundo?

El aprendizaje profundo tiene varios casos de uso en los sectores automotriz, aeroespacial, manufacturero, electrónico y de investigación médica, entre otros.

Los vehículos autónomos utilizan modelos de aprendizaje profundo para la detección de objetos.
Los sistemas de defensa utilizan el aprendizaje profundo para identificar y marcar zonas de interés en las imágenes satelitales.
El aprendizaje profundo se utiliza en el análisis de imágenes médicas para detectar las células cancerosas y realizar un diagnóstico médico.
Las fábricas utilizan aplicaciones de aprendizaje profundo para detectar si las personas u objetos se encuentran a una distancia insegura de las máquinas.

Estos diversos casos de uso del aprendizaje profundo se pueden agrupar en cinco grandes categorías: visión artificial, reconocimiento del habla, procesamiento de lenguaje natural (NLP), motores de recomendación e IA generativa.

Visión artificial

La visión artificial extrae automáticamente la información y los conocimientos de las imágenes y los videos. Técnicas de aprendizaje profundo para comprender las imágenes de la misma manera que lo hacen los humanos. La visión artificial tiene varias aplicaciones, como las siguientes:

Moderación de contenido para eliminar de forma automática los contenidos inseguros o inapropiados de los archivos de imágenes y videos
Reconocimiento facial para identificar rostros y reconocer atributos como ojos abiertos, gafas y vello facial
La clasificación de imágenes para identificar los logotipos de las marcas, la ropa, el equipo de seguridad y otros detalles de la imagen

Reconocimiento de voz

Los modelos de aprendizaje profundo pueden analizar el habla humana a pesar de que varíen los patrones de habla, el tono, el idioma y el acento. Los asistentes virtuales, como Amazon Alexa o el software de conversión de texto a voz y de voz a texto, utilizan el reconocimiento de voz para llevar a cabo las siguientes tareas:

Apoyar a los agentes de los centros de llamadas y clasificar las llamadas de forma automática.
Convertir las conversaciones clínicas en documentación en tiempo real.
Subtitular con precisión los videos y las grabaciones de las reuniones para que los contenidos tengan un mayor alcance.
Convertir los guiones en peticiones para obtener asistencia de voz inteligente.

Procesamiento de lenguaje natural

Las computadoras utilizan algoritmos de aprendizaje profundo para obtener información y significado a partir de datos de texto y documentos. Esta capacidad de procesar texto natural creado por humanos tiene varios casos de uso, como en estas funciones:

Chatbots y agentes virtuales automatizados
Resumen automático de documentos o artículos de noticias
Análisis de inteligencia empresarial de documentos largos, como correos electrónicos y formularios
Indexación de frases clave que indican la opinión, como los comentarios positivos y negativos en las redes sociales

Motores de recomendaciones

Las aplicaciones pueden utilizar métodos de aprendizaje profundo para hacer un seguimiento de la actividad del usuario y desarrollar recomendaciones personalizadas. Pueden analizar el comportamiento de los usuarios y ayudarles a descubrir nuevos productos o servicios. Por ejemplo:

Recomendar videos y contenidos personalizados.
Recomendar productos y servicios personalizados.
Filtrar los resultados de búsqueda para resaltar el contenido relevante en función de la ubicación y el comportamiento del usuario.

IA generativa

Las aplicaciones de IA generativa pueden crear contenido nuevo y comunicarse con los usuarios finales de forma más sofisticada. Pueden ayudar a automatizar flujos de trabajo complejos, generar ideas y búsquedas inteligentes de conocimiento. Por ejemplo, con herramientas de IA generativa como Amazon Q Business y Amazon Q Developer, los usuarios pueden hacer lo siguiente:

Hacer preguntas en lenguaje natural y obtener respuestas resumidas de varios orígenes de conocimiento internas.
Recibir sugerencias de código y escaneos y actualizaciones automáticos de código.
Crear nuevos documentos, correos electrónicos y otro contenido de marketing con mayor rapidez.

¿Cómo funciona el aprendizaje profundo?

Los modelos de aprendizaje profundo son redes neuronales diseñadas a partir del cerebro humano. Un cerebro humano contiene millones de neuronas interconectadas biológicamente que trabajan juntas para aprender y procesar información. Del mismo modo, las neuronas artificiales son módulos de software llamados nodos que utilizan cálculos matemáticos para procesar datos. Las redes neuronales de aprendizaje profundo, o redes neuronales artificiales, comprenden muchas capas de neuronas artificiales que trabajan juntas para resolver problemas complejos.

A continuación, se indican los componentes de una red neuronal profunda.

Capa de entrada

Una red neuronal artificial tiene varios nodos que introducen datos en esta. Estos nodos forman la capa de entrada del sistema.

Capa oculta

La capa de entrada procesa los datos y los transmite a otras capas de la red neuronal. Estas capas ocultas procesan la información a diferentes niveles. Además, adaptan su comportamiento a medida que reciben nueva información. Las redes de aprendizaje profundo tienen cientos de capas ocultas que sirven para analizar un problema desde diferentes puntos de vista.

Por ejemplo, si recibiera una imagen de un animal desconocido que tuviera que clasificar, lo compararía con animales que ya conoce. Por ejemplo, observaría la forma de sus ojos y orejas, el tamaño, el número de patas y el patrón de pelaje. Intentaría identificar patrones, como los siguientes:

El animal tiene pezuñas, por lo que podría ser una vaca o un venado.
El animal tiene ojos de gato, por lo que podría ser un gato salvaje.

Las capas ocultas de las redes neuronales profundas operan de la misma manera. Si un algoritmo de aprendizaje profundo intenta clasificar la imagen de un animal, cada una de sus capas ocultas procesa una característica animal diferente e intenta clasificarla con precisión.

Capa de salida

La capa de salida está formada por los nodos que emiten los datos de salida. Los modelos de aprendizaje profundo que arrojan como salida respuestas “sí” o “no” únicamente tienen dos nodos en la capa de salida. Por otro lado, los que arrojan como salida una mayor variedad de respuestas tienen más nodos. La IA generativa tiene una capa de salida sofisticada para generar nuevos datos que coincidan con los patrones de su conjunto de datos de entrenamiento.

¿Cuál es la diferencia entre el machine learning, el aprendizaje profundo y la IA generativa?

Los términos machine learning, aprendizaje profundo e IA generativa indican una progresión en la tecnología de redes neuronales.

Machine learning

El aprendizaje profundo es un subconjunto del machine learning. Los algoritmos de aprendizaje profundo surgieron al aumentar la eficacia de las técnicas tradicionales de machine learning. Bajo los métodos tradicionales de machine learning, se requiere un importante esfuerzo humano para entrenar el software. Por ejemplo, en el reconocimiento de imágenes de animales, es necesario hacer lo siguiente:

Etiquetar manualmente cientos de miles de imágenes de animales.
Hacer que los algoritmos de machine learning procesen esas imágenes.
Probar esos algoritmos en un conjunto de imágenes desconocidas.
Identificar las razones por las que algunos resultados son inexactos.
Mejorar el conjunto de datos mediante el etiquetado de nuevas imágenes para mejorar la precisión de los resultados.

Este proceso se denomina aprendizaje supervisado. En el aprendizaje supervisado, la precisión de los resultados solo mejora con un conjunto de datos amplio y suficientemente variado. Por ejemplo, es posible que el algoritmo identifique con precisión a los gatos negros, pero no a los blancos, porque el conjunto de datos de entrenamiento tenía más imágenes de gatos negros. En ese caso, necesitaría más datos etiquetados de imágenes de gatos blancos y entrenar de nuevo los modelos de machine learning.

Ventajas del aprendizaje profundo frente al machine learning

Una red de aprendizaje profundo tiene las siguientes ventajas con respecto al machine learning tradicional.

Procesamiento eficiente de datos no estructurados

Para los métodos de machine learning, los datos no estructurados, como los documentos de texto, son difíciles de procesar porque el conjunto de datos de entrenamiento puede tener infinitas variaciones. En cambio, los modelos de aprendizaje profundo son capaces de comprender los datos no estructurados y hacer observaciones generales sin necesidad de extraer manualmente las características. Por ejemplo, una red neuronal puede reconocer que estas dos frases de entrada diferentes tienen el mismo significado:

¿Puede explicarme cómo hacer el pago?
¿Cómo puedo transferir dinero?

Relaciones ocultas y detección de patrones

Una aplicación de aprendizaje profundo puede analizar grandes cantidades de datos con mayor profundidad y revelar nueva información sobre la cual podría no haber sido entrenada. Por ejemplo, considere un modelo de aprendizaje profundo entrenado para analizar las compras hechas por los consumidores. El modelo únicamente tiene datos sobre los productos que ya se han comprado. Sin embargo, la red neuronal artificial puede sugerir nuevos artículos que aún no se han comprado al comparar los patrones de compra con los de clientes similares.

Aprendizaje no supervisado

Los modelos de aprendizaje profundo pueden aprender y mejorar a lo largo del tiempo en función del comportamiento del usuario. No requieren grandes variaciones de conjuntos de datos etiquetados. Por ejemplo, consideremos una red neuronal que corrija o sugiera palabras de forma automática mediante el análisis de su comportamiento de escritura. Supongamos que se entrenó en inglés y que es posible corregir la ortografía de las palabras en inglés. Sin embargo, si escribe con frecuencia palabras que no están en inglés, como danke, la red neuronal aprende automáticamente y las incluye en la función de autocorrección.

Procesamiento de datos volátiles

Los conjuntos de datos volátiles tienen grandes variaciones. Un ejemplo son los importes de los pagos de los préstamos en un banco. Una red neuronal de aprendizaje profundo también puede categorizar y ordenar esos datos al analizar las transacciones financieras e identificar y marcar algunas para detectar fraudes.

Más información sobre las diferencias entre el aprendizaje profundo y el machine learning »

IA generativa

La IA generativa llevó las redes neuronales del machine learning y el aprendizaje profundo al siguiente nivel. Mientras que el machine learning y el aprendizaje profundo se centran en la predicción y el reconocimiento de patrones, la IA generativa produce resultados únicos en función de los patrones que detecta. La tecnología de IA generativa se basa en la arquitectura transformadora que combina varias redes neuronales diferentes para combinar patrones de datos de formas únicas. Las redes de aprendizaje profundo primero convierten el texto, las imágenes y otros datos en abstracciones matemáticas y, después, los reconvierten en nuevos patrones significativos.

¿Cuáles son los desafíos que plantea el aprendizaje profundo?

Los desafíos en la implementación del aprendizaje profundo y la IA generativa se detallan a continuación.

Grandes cantidades de datos de alta calidad

Cuando los entrena con grandes cantidades de datos de alta calidad, los algoritmos de aprendizaje profundo ofrecen mejores resultados. Los valores atípicos o los errores en el conjunto de datos de entrada pueden repercutir significativamente en el proceso de aprendizaje profundo. Por ejemplo, en nuestro ejemplo de imágenes de animales, el modelo de aprendizaje profundo podría clasificar un avión como tortuga si el conjunto de datos ingresa accidentalmente imágenes que no son de animales.

Para evitar estas imprecisiones, es necesario limpiar y procesar grandes cantidades de datos antes de entrenar los modelos de aprendizaje profundo. El procesamiento previo de los datos de entrada requiere una gran capacidad de almacenamiento de datos.

Gran potencia de procesamiento

Los algoritmos de aprendizaje profundo requieren un uso intensivo de la computación y una infraestructura con suficiente capacidad de computación para funcionar correctamente. De otro modo, tardan mucho en procesar los resultados.

¿Cuáles son los beneficios de la IA generativa y el aprendizaje profundo en la nube?

La ejecución de la IA generativa y el aprendizaje profundo en la infraestructura en la nube le ayuda a diseñar, desarrollar y entrenar aplicaciones con mayor rapidez.

Velocidad

Es posible entrenar modelos de IA generativa y aprendizaje profundo con mayor rapidez mediante el uso de clústeres de GPU y CPU para llevar a cabo las complejas operaciones matemáticas que requieren las redes neuronales. A continuación, se pueden implementar estos modelos para procesar grandes cantidades de datos y producir resultados cada vez más relevantes.

Escalabilidad

Gracias a la amplia gama de recursos bajo demanda disponibles a través de la nube, se puede acceder a recursos de hardware prácticamente ilimitados para abordar modelos de aprendizaje profundo de IA de cualquier tamaño. Las redes neuronales pueden recurrir a varios procesadores para distribuir sin problemas y de forma eficaz las cargas de trabajo entre distintos tipos y cantidades de procesadores.

Herramientas

Puede acceder a herramientas de IA y aprendizaje profundo, como cuadernos, depuradores, generadores de perfiles, canalizaciones, AIOps y más. Puede trabajar con los modelos de IA generativa existentes desde la nube como un servicio sin necesidad de infraestructura para alojar el modelo. Los equipos pueden empezar con aplicaciones de IA generativa y aprendizaje profundo, incluso con conocimientos y formación limitados.

¿Cómo puede ayudar AWS con sus requisitos de IA generativa y aprendizaje profundo?

Los servicios de IA y aprendizaje profundo de AWS aprovechan el poder de la computación en la nube para que pueda crear y escalar la próxima ola de innovación en IA. Reinvente las experiencias de los clientes con los servicios diseñados específicamente más completos, la infraestructura de IA, la tecnología de aprendizaje profundo y las soluciones de IA generativa más completos. Por ejemplo:

Amazon SageMaker proporciona infraestructuras, herramientas y flujos de trabajo totalmente administrados para el desarrollo del aprendizaje profundo y el machine learning.
Amazon Bedrock proporciona una API única para acceder y utilizar varios modelos básicos de alto rendimiento de las principales empresas de IA.

También puede utilizar la infraestructura de IA de AWS para acceder a una computación, un almacenamiento y una red completos, seguros y con una buena relación calidad-precio para crear cualquier aplicación de IA. Cree una cuenta de AWS gratuita hoy para comenzar a trabajar con el aprendizaje profundo de IA en AWS.

Servicios de aprendizaje profundo diseñados específicamente en AWS