Publicado en: Jun 28, 2022
Amazon SageMaker ofrece un conjunto de algoritmos integrados, modelos con entrenamiento previo y plantillas de soluciones prediseñadas para que los científicos de datos y los profesionales del aprendizaje automático comiencen a entrenar e implementar modelos de aprendizaje automático rápidamente. Estos algoritmos y modelos se pueden usar tanto para el aprendizaje supervisado como para el no supervisado. Pueden procesar distintos tipos de datos de entrada, incluidos datos tabulares, imágenes y textos.
A partir de ahora, Amazon SageMaker ofrece cuatro nuevos algoritmos de modelado de datos tabulares: LightGBM, CatBoost, AutoGluon-Tabular y TabTransformer. Estos famosos algoritmos de última generación se pueden usar para tareas de regresión y de clasificación tabular. Están disponibles por medio de la interfaz de usuario de SageMaker JumpStart, dentro de SageMaker Studio, y del código de Python al usar el SDK para Python de SageMaker. A continuación encontrará ejemplos de blocs de notas de SageMaker que le permitirán aprender a usar estos algoritmos:
- LightGBM es una implementación popular y de alto rendimiento de código abierto del árbol de decisiones con potenciación de gradientes (Gradient Boosting Decision Tree, GBDT). Para aprender a usar este algoritmo, consulte los ejemplos de blocs de notas para tareas de clasificación y de regresión.
- CatBoost es otra implementación popular y de alto rendimiento de código abierto del árbol de decisiones con potenciación de gradientes (GBDT). Para aprender a usar este algoritmo, consulte los ejemplos de blocs de notas para tareas de clasificación y de regresión.
- AutoGluon-Tabular es un proyecto de código abierto de AutoML que fue desarrollado por Amazon, quien también está a cargo de su mantenimiento. Este algoritmo ejecuta procesamientos de datos avanzados, tareas de aprendizaje profundo y conjuntos de pilas multicapa. Para aprender a usar este algoritmo, consulte los ejemplos de blocs de notas para tareas de clasificación y de regresión.
- TabTransformer es una novedosa arquitectura de modelado profundo de datos tabulares diseñada a partir de Transformers que se basan en la autoatención, un desarrollo innovador de la investigación científica de Amazon. Para aprender a usar este algoritmo, consulte los ejemplos de blocs de notas para tareas de clasificación y de regresión.
Obtenga una explicación detallada acerca de cómo usar estos algoritmos en las siguientes entradas de blog: Bringing the power of deep learning to data in tables (El poder del aprendizaje profundo al servicio de los datos en tablas) y New built-in Amazon SageMaker algorithms for tabular data modeling: LightGBM, CatBoost, AutoGluon-Tabular, and TabTransformer (Nuevos algoritmos integrados de Amazon SageMaker para el modelado de datos tabulares: LightGBM, CatBoost, AutoGluon-Tabular y TabTransformer).
Estos cuatro algoritmos se pueden usar en todas las regiones en las que Amazon SageMaker está disponible. Para empezar a trabajar con estos nuevos modelos en SageMaker, consulte la documentación.