发布于: Jun 28, 2022

Amazon SageMaker 提供一套内置算法、预训练模型和预置解决方案模板,以帮助数据科学家和机器学习从业人员快速地开始使用训练和部署机器学习模型。这些算法和模型可同时用于有监督的学习和无监督的学习。它们可以处理各种输入数据类型,其中包括表格、图像和文本。

即日起,Amazon SageMaker 提供四种表格式数据建模算法:LightGBM、CatBoost、AutoGluon-Tabular 和 TabTransformer. 这些最先进的热门算法可同时用于表格式分类和回归任务。这些算法可通过 SageMaker Studio 内部的 SageMaker JumpStart UI 和使用 SageMaker Python SDKpython 代码获取。 要了解如何使用这些算法,您可以查找下面的 SageMaker 示例笔记本:

  • LightGBM 是热门的高性能开源框架,可实施梯度提升方法决策树 (GBDT)。要了解如何使用这个算法,请查看分类回归的示例笔记本。
  • CatBoost 是另一个热门的高性能开源框架,可用于实施梯度提升方法决策树 (GBDT)。要了解如何使用这个算法,请查看分类回归的示例笔记本。
  • AutoGluon-Tabular 是 Amazon 开发和维护的一个开源 AutoML 项目,可执行高级数据处理、深度学习和多层堆栈集成。要了解如何使用这个算法,请查看分类回归的示例笔记本。
  • TabTransformer 是一个新型的深度表格式数据建模架构,以基于自注意力机制的 Transformer 为基础构建,是 Amazon 科学研究的一项创新。要了解如何使用这个算法,请查看分类回归的示例笔记本。

有关如何使用这些算法的更详细说明,请访问以下有关 Bringing the power of deep learning to data in tables(将深度学习的强大功能引入表格中的数据) 和 New built-in Amazon SageMaker algorithms for tabular data modeling: LightGBM, CatBoost, AutoGluon-Tabular, and TabTransformer(适用于表格式数据建模的全新内置 Amazon SageMaker 算法:LightGBM、CatBoos、AutoGluon-Tabular 和 TabTransformer)的博文。

在提供 Amazon SageMaker 的所有区域均可使用这四种算法。要开始在 Amazon SageMaker 上使用这些新模型,请参阅相关文档