Amazon SageMaker

Cree, entrene e implemente modelos de aprendizaje automático a escala

Amazon SageMaker es una plataforma completamente administrada que permite a los desarrolladores y científicos de datos crear, entrenar e implementar modelos de aprendizaje automático de forma rápida y sencilla a cualquier escala. Amazon SageMaker elimina todas las dificultades que suelen ralentizar a los desarrolladores que desean utilizar el aprendizaje automático.

La mayoría de los desarrolladores suelen encontrar el aprendizaje automático mucho más arduo de lo que debería ser, ya que el proceso de crear y entrenar modelos (y luego implementarlos en la producción) es demasiado complicado y lento. En primer lugar, debe recopilar y preparar sus datos de entrenamiento para averiguar qué elementos de su conjunto de datos son importantes. A continuación, debe seleccionar el algoritmo y el marco de trabajo que vaya a utilizar. Tras decidir su enfoque, tiene que enseñarle al modelo cómo generar predicciones mediante el entrenamiento, lo cual requiere mucha computación. Luego debe ajustar el modelo de forma que ofrezca las mejores predicciones posibles, una labor manual que suele resultar tediosa. Tras haber desarrollado un modelo completamente entrenado, debe integrarlo con su aplicación e implementar esta última en una infraestructura que permita el escalado. Para todo este proceso hace falta experiencia especializada, acceso a grandes cantidades de computación y almacenamiento, y mucho tiempo para experimentar y optimizar cada parte del proceso. Al final, no es de extrañar que la mayoría de los desarrolladores consideren todo esto inalcanzable.

Amazon SageMaker elimina la complejidad que impide que los desarrolladores completen cada uno de estos pasos correctamente. Amazon SageMaker incluye módulos que se pueden utilizar juntos o por separado para crear, entrenar e implementar modelos de aprendizaje automático.

Presentación de Amazon SageMaker

Funcionamiento

Creación

Amazon SageMaker facilita la creación de modelos de aprendizaje automático y su preparación para el entrenamiento, además de proporcionar todo lo necesario para conectar rápidamente con los datos de entrenamiento y para seleccionar y optimizar el algoritmo y el marco de trabajo óptimos para la aplicación. Amazon SageMaker incluye cuadernos de Jupyter alojados que facilitan el análisis y la visualización de los datos de entrenamiento almacenados en Amazon S3. Puede conectar directamente con los datos en S3, o bien utilizar AWS Glue a fin de migrar datos de Amazon RDS, Amazon DynamoDB y Amazon Redshift a S3 para su análisis en el bloc de notas.

Para ayudarlo a seleccionar el algoritmo, Amazon SageMaker incluye los algoritmos de aprendizaje automático más comunes, preinstalados y optimizados para ofrecer un rendimiento hasta 10 veces superior al que conseguiría si los ejecutara en cualquier otro lugar. Amazon SageMaker también viene preconfigurado para ejecutar TensorFlow, Apache MXNet y Chainer en contenedores Docker. También puede descargar estos contenedores de código abierto en su entorno local y usar el SDK para Python de Amazon SageMaker a fin de probar sus scripts en modo local antes de utilizar Amazon SageMaker para el entrenamiento o el alojamiento de su modelo en producción. También tiene la opción de utilizar su propio marco de trabajo.

Entrenamiento

Puede comenzar a entrenar un modelo con un solo clic en la consola de Amazon SageMaker. Amazon SageMaker administra automáticamente toda la infraestructura subyacente y se puede escalar fácilmente para entrenar modelos de varios petabytes. Para que el proceso de entrenamiento sea incluso más rápido y sencillo, Amazon SageMaker puede ajustar automáticamente el modelo con el fin de lograr la mayor precisión posible.

Implementación

Una vez que el modelo esté entrenado y ajustado, Amazon SageMaker facilitará la tarea de ponerlo en producción para empezar a generar predicciones (un proceso denominado inferencia) para datos en lotes o en tiempo real. Amazon SageMaker implementa el modelo en clústeres de escalado automático de instancias de aprendizaje automático de Amazon SageMaker distribuidas en varias zonas de disponibilidad para ofrecer un alto nivel de rendimiento y disponibilidad. Amazon SageMaker también incluye pruebas A/B integradas para contribuir a probar el modelo y experimentar con diferentes versiones con objeto de obtener los mejores resultados.

Amazon SageMaker elimina el trabajo pesado del aprendizaje automático, lo que le permite crear, entrenar e implementar modelos de aprendizaje automático de forma rápida y sencilla.

Beneficios

Rápido paso a producción con Machine Learning

Amazon SageMaker reduce de manera significativa la cantidad de tiempo necesario para entrenar, ajustar e implementar los modelos de aprendizaje automático. Amazon SageMaker administra y automatiza todas las técnicas sofisticadas de entrenamiento y ajuste de modo que pueda poner en marcha los modelos en producción rápidamente.

Compatibilidad con cualquier marco de trabajo o algoritmo

Amazon SageMaker es compatible con todos los marcos de trabajo y algoritmos de aprendizaje automático, por lo que puede utilizar la tecnología que ya domina. Apache MXNet, TensorFlow y Chainer están preinstalados, y Amazon SageMaker ofrece una variedad de algoritmos de aprendizaje automático integrados y de alto rendimiento. Si desea entrenar con un marco de trabajo o algoritmo alternativo, puede usar su propio contenedor Docker.

Entrenamiento e implementación con un solo clic

Amazon SageMaker le permite empezar a entrenar su modelo con un solo clic en la consola o con una simple llamada de API. Cuando haya terminado el entrenamiento y ya pueda implementar el modelo, puede iniciarlo con solo hacer clic en la consola de Amazon SageMaker.

Integración sencilla con el flujo de trabajo existente

Amazon SageMaker está diseñado en tres módulos que pueden utilizarse en conjunto o por separado como parte de cualquier flujo de trabajo existente de aprendizaje automático que utilice.

Acceso sencillo a modelos entrenados

Amazon SageMaker facilita la integración de los modelos de aprendizaje automático en sus aplicaciones al proporcionar un punto de enlace HTTPS al que se puede llamar desde cualquier aplicación.

Optimización para lograr mayor velocidad

Amazon SageMaker viene preconfigurado con las versiones más recientes de TensorFlow, Apache MXNet y Chainer, con soporte para bibliotecas CUDA9 a fin de lograr un nivel de rendimiento máximo con las GPU NVIDIA. Con instancias P3 de Amazon SageMaker que se ejecutan en GPU NVIDIA Volta V100, Amazon SageMaker le permite entrenar modelos de aprendizaje profundo con una velocidad única.

Clientes de SageMaker destacados

Realice entrenamientos con cualquier marco de aprendizaje profundo

Con Amazon SageMaker, puede usar el marco de aprendizaje profundo de su preferencia para entrenar modelos. Tan solo debe incorporar su propio contenedor Docker con sus bibliotecas y marcos preferidos –como Caffe2, PyTorch, Microsoft Cognitive Toolkit (CNTK), Chainer o Torch– y Amazon SageMaker administrará la infraestructura subyacente a fin de entrenar sus modelos.

TensorFlow
Caffe2
Apache MXNet
Chainer
Keras
Torch
Gluon
Microsoft Cognitive Toolkit
PyTorch

Casos de uso

Publicidad dirigida a un público específico

El uso de Amazon SageMaker junto con otros servicios de AWS lo ayudará a optimizar sus beneficios sobre los gastos publicitarios. Amazon SageMaker puede entrenar e implementar fácilmente modelos de aprendizaje automático capaces de dirigir los anuncios publicitarios online a un público específico de forma más eficiente, lo que permite aumentar el nivel de compromiso de los clientes y su conversión. En el entorno distribuido y sin servidor de Amazon SageMaker, es posible entrenar modelos de sistemas de recomendación, predicción con un clic, segmentación de clientes y aumento del valor del tiempo de vida del cliente. Una vez creados, los modelos se pueden alojar fácilmente en puntos de enlace de escalado automático y baja latencia, o bien se pueden pasar a otros sistemas de puja en tiempo real.

Predicción de incumplimiento crediticio

Amazon SageMaker facilita la predicción de la probabilidad de incumplimiento crediticio, un problema habitual en el aprendizaje automático. Amazon SageMaker se integra correctamente con los marcos de trabajo analíticos existentes (como Amazon Redshift, Amazon EMR o AWS Glue), lo que le permite publicar conjuntos de datos grandes y diversos en un lago de datos de Amazon S3, transformarlos rápidamente, crear modelos de aprendizaje automático e inmediatamente alojarlos para la predicción online.

IoT industrial y Machine Learning

El IoT industrial y el aprendizaje automático pueden realizar predicciones en tiempo real (con las que anticipar los errores de las máquinas) o la programación del mantenimiento con el fin de lograr mayores niveles de eficiencia.  Es posible generar un gemelo digital, o réplica, de recursos físicos, procesos o sistemas, para predecir mantenimientos preventivos o para optimizar la producción de procesos industriales o máquinas complejas. El modelo se puede actualizar continuamente para que “aprenda” en tiempo real en caso de que ocurran modificaciones.

Cadena de suministro y previsión de demanda

Amazon SageMaker provee la infraestructura y los algoritmos necesarios para desarrollar previsiones de ventas individuales para cada producto en los escenarios de E-Commerce más amplios. Con tan solo los datos de categorías de productos y series temporales, Amazon SageMaker recoge estacionalidades, tendencias y similitudes entre productos para suministrar previsiones precisas, incluso para elementos nuevos.

Predicciones de enlaces visitados

Amazon SageMaker provee implementaciones de CPU distribuidas y en un único equipo de algoritmos XGboost, que resultan útiles en varios casos de uso de clasificación, regresión y jerarquización, como la predicción del índice de enlaces visitados. Los sistemas de predicción de enlaces visitados son una parte fundamental de los sistemas publicitarios online, ya que resulta esencial predecir el índice de enlaces visitados (CTR) más preciso posible para garantizar que los consumidores tengan la mejor experiencia. Mediante el uso del algoritmo XGBoost, puede ejecutar un predictor en tiempo real y obtener un resultado de predicción con puntaje. A continuación, puede determinar si presentará o no anuncios de un publicista en particular y mejorar la predicción CTR en la visualización de anuncios.

Predicción de la calidad de contenido

Amazon SageMaker cuenta con herramientas para preprocesar y encontrar estructuras en textos, y utiliza dicha información para realizar predicciones acerca de la calidad del contenido. Puede generar incrustaciones de palabras para encontrar estructuras sintácticas o semánticas similares en volúmenes de texto grandes, y agrupar palabras similares para evitar el aislamiento. A continuación, se pueden agrupar en clústeres de manera independiente documentos similares con los modelos de temas avanzados de Amazon SageMaker. Finalmente, es posible crear modelos de clasificación independientes por clúster en los datos de palabras agrupados de dimensión reducida para determinar si los documentos deben ser moderados.

Más información sobre Amazon SageMaker

Visite la página de características
¿Todo listo para crear?
Introducción a Amazon SageMaker