Cree con Amazon SageMaker
Amazon SageMaker facilita la creación de modelos de aprendizaje automático a escala y los prepara para el entrenamiento, ya que proporciona todo lo que necesita para etiquetar los datos de entrenamiento, para acceder a los blocs de notas y compartirlos, y para utilizar los algoritmos y los marcos incorporados.
Características
Experiencia colaborativa en el bloc de notas
Los blocs de notas de Amazon SageMaker Studio son blocs de notas de Jupyter de un solo clic con informática elástica que se puede iniciar con rapidez. Los blocs de notas contienen todo lo necesario para ejecutar o volver a crear un flujo de trabajo de aprendizaje automático, y se integran en Amazon SageMaker Studio. Ya vienen cargados con todos los controladores CUDA y cuDNN comunes, los paquetes de Anaconda y las bibliotecas de marco.
El entorno del bloc de notas le permite explorar y visualizar sus datos, además de documentar sus hallazgos en flujos de trabajo reutilizables. Desde el interior del bloc de notas, puede incorporar sus datos almacenados en Amazon S3. También puede usar AWS Glue para migrar datos fácilmente desde Amazon RDS, Amazon DynamoDB y Amazon Redshift a S3 a fin de realizar análisis.
Cree conjuntos de datos precisos para los entrenamientos
Amazon SageMaker Ground Truth lo ayuda a crear conjuntos de datos de entrenamiento de alta precisión con rapidez mediante el aprendizaje automático. Además, le permite reducir los costos de etiquetado de datos hasta en un 70 %. Los modelos de aprendizaje automático correctos se entrenan con datos que se han etiquetado para enseñar al modelo a tomar las decisiones adecuadas. Este proceso suele requerir meses y grandes equipos de personas para completarse. SageMaker Ground Truth ofrece una solución innovadora para reducir el costo y la complejidad, además de aumentar la precisión del etiquetado de datos mediante la combinación del etiquetado humano con el proceso de aprendizaje automático denominado aprendizaje activo.

Procesamiento de datos totalmente administrado a escala
Con frecuencia, las cargas de trabajo de procesamiento y análisis de datos para el aprendizaje automático se ejecutan en una infraestructura autoadministrada que es difícil de asignar y escalar, a medida que cambian los requisitos de la empresa. El uso de diferentes herramientas para lograr esto se vuelve complicado, lo que resulta en un rendimiento inferior al óptimo y en un aumento de los gastos de capital y de operación. El procesamiento de Amazon SageMaker supera este desafío mediante la ampliación de la facilidad, la escalabilidad y la confiabilidad de SageMaker a una experiencia de administración completa para la ejecución de cargas de trabajo de procesamiento de datos a escala. El procesamiento de SageMaker le permite conectarse a orígenes de datos de sistemas de archivos o de almacenamiento existentes, activar los recursos necesarios para ejecutar su trabajo, guardar los resultados en almacenamiento persistente y brindar los registros y las métricas. También puede usar sus propios contenedores con los marcos que prefiera y aprovechar la ejecución de cargas de trabajo de procesamiento y de análisis de datos.
Algoritmos integrados de alto rendimiento
Amazon SageMaker ofrece algoritmos de aprendizaje automático escalables y de alto rendimiento que se optimizaron para brindar velocidad, escala y precisión, y pueden realizar entrenamiento en conjuntos de datos con escala de petabytes. Puede elegir algoritmos supervisados en los que las respuestas correctas se conocen durante el entrenamiento y puede indicar al modelo dónde cometió errores. SageMaker incluye algoritmos supervisados, como regresión o clasificación lineal/logística, y XGBoost, para resolver problemas de predicción de serie temporal y recomendaciones. SageMaker también admite el aprendizaje no supervisado (es decir, los algoritmos deben encontrar las respuestas correctas por sí mismos), como agrupación en clústeres k-means y análisis de componente principal (PCA), para resolver problemas como la identificación de agrupaciones de clientes en función de su comportamiento de compra.
Amplia compatibilidad con marcos
Amazon SageMaker es compatible con muchos marcos populares para el aprendizaje profundo, como TensorFlow, Apache MXNet, PyTorch, Chainer y otros. Estos marcos se configuran y optimizan automáticamente para alcanzar un alto rendimiento. No necesita configurar estos marcos de forma manual y puede utilizarlos dentro de los contenedores incorporados. También puede incorporar cualquier marco que desee en SageMaker. Para ello, debe crearlo en un contenedor Docker que pueda almacenar en Amazon EC2 Container Registry.
Pruebas y prototipos en entornos locales
Los contenedores Docker de código abierto Apache MXNet y TensorFlow que se usan en Amazon SageMaker están disponibles en GitHub. Puede descargarlos en su entorno local y usar el SDK para Python de SageMaker a fin de probar scripts antes de la implementación en entornos de entrenamiento o alojamiento de SageMaker. Cuando esté listo para trasladarse de un entorno de pruebas local a uno de alojamiento o entrenamiento de producción, solo necesitará modificar una única línea de código.
Aprendizaje mediante refuerzo
Amazon SageMaker admite el aprendizaje mediante refuerzo además del aprendizaje tradicional supervisado y no supervisado. Dispone de algoritmos de aprendizaje reforzado integrados y completamente administrados, incluidos algunos de los mejores y más recientes de la literatura académica. SageMaker admite el aprendizaje mediante refuerzo en varios marcos de trabajo (incluidos TensorFlow y MXNet), así como marcos más recientes, diseñados desde un principio para este tipo de aprendizaje, como Intel Coach y Ray RL. Se admiten diversos entornos de simulación de física 2D y 3D, incluidos entornos basados en la interfaz OpenGym de código abierto. Asimismo, SageMaker RL le permitirá entrenar con entornos 3D virtuales integrados en Amazon Sumerian y Amazon RoboMaker. Para ayudarlo a empezar, SageMaker también proporciona una serie de blocs de notas y tutoriales de ejemplo.
Recursos
Una guía paso a paso para crear modelos de aprendizaje automático
Aprenda a crear modelos de aprendizaje automático en Amazon SageMaker.
Blocs de notas de muestra de Amazon SageMaker
Acceda a amplios repositorios de blocs de notas de muestra de Amazon SageMaker en GitHub.