Publicado: Jun 28, 2022
O Amazon SageMaker oferece um conjunto de algoritmos incorporados, modelos pré-treinados e modelos de solução incorporados para ajudar cientistas de dados e profissionais de machine learning a começar a fazer treinamentos e implantar modelos de machine learning com rapidez. Esses algoritmos e modelos podem ser usados para aprendizado com ou sem supervisão. Eles podem processar vários tipos de dados de entrada, como dados tabulares, imagens e textos.
A partir de hoje, o Amazon SageMaker oferece quatro novos algoritmos de modelagem de dados tabulares: LightGBM, CatBoost, AutoGluon-Tabular e TabTransformer. Esses algoritmos populares e avançados podem ser usados para tarefas de classificação e regressão tabulares. Eles estão disponíveis no SageMaker JumpStart UI, dentro do SageMaker Studio, bem como em código Python usando o SageMaker Python SDK. Para aprender a usar esses algoritmos, veja estes exemplos de cadernos do SageMaker:
- O LightGBM é uma implementação popular, de código aberto e alto desempenho da Gradient Boosting Decision Tree (GBDT – Árvore de decisão de boosting de gradiente). Para aprender a usar esse algoritmo, veja os exemplos de cadernos de classificação e regressão.
- O CatBoost é outra implementação popular, de código aberto e alto desempenho da Gradient Boosting Decision Tree (GBDT – Árvore de decisão de boosting de gradiente). Para aprender a usar esse algoritmo, veja os exemplos de cadernos de classificação e regressão.
- O AutoGluon-Tabular é um projeto de código aberto de AutoML, desenvolvido e mantido pela Amazon, que executa processamento de dados, aprendizado profundo e montagem de pilhas multicamada avançados. Para aprender a usar esse algoritmo, veja os exemplos de cadernos de classificação e regressão.
- O TabTransformer é uma nova arquitetura de modelagem de dados tabulares que usa transformadores baseados em autoatenção, uma inovação das pesquisas científicas da Amazon. Para aprender a usar esse algoritmo, veja os exemplos de cadernos de classificação e regressão.
Para encontrar explicações mais detalhadas sobre o uso desses algoritmos, consulte as publicações de blog Bringing the power of deep learning to data in tables (Como usar recursos de aprendizado profundo em dados de tabelas) e New built-in Amazon SageMaker algorithms for tabular data modeling: LightGBM, CatBoost, AutoGluon-Tabular, and TabTransformer (Novos algoritmos incorporados do Amazon SageMaker para modelagem de dados tabulares: LightGBM, CatBoost, AutoGluon-Tabular e TabTransformer).
Todos esses quatro algoritmos podem ser usados em todas as regiões em que o Amazon SageMaker está disponível. Para começar a usar esses novos modelos no SageMaker, consulte a documentação.