发布于: Dec 3, 2019
Amazon SageMaker Autopilot 现已正式发布。借助此项功能,Amazon SageMaker 可以使用表格式数据和您指定的目标列来自动训练和调整模型,同时提供对流程的完全可见性。顾名思义,您可以在自动辅助驾驶仪上使用它,在 Amazon SageMaker Studio 中单击一下即可部署高度准确的模型,或者将其用作决策指南,以便取舍权衡,例如在延迟与准确性和模型大小之间权衡。
通常,确定哪种 ML 算法最适合某个数据集就非常困难,更不用说找到合适的算法参数了。此外,为了构建良好的 ML 模型,您需要清理数据或对数据进行预处理。这些活动非常耗时,有时甚至需要高级机器学习技能。这些问题会导致团队转向捷径或变通办法,例如按原样使用数据集而不清理数据或进行预处理。团队最终采用的往往是易于使用的算法,而不是适合当前问题的正确算法。结果就是,企业难以获得理想的模型质量。另外,具有丰富 ML 知识的数据科学家需要花费大量时间来尝试不同的 ML 模型,然后再找出适合特定问题的最佳模型,尤其是对于具有模型大小和延迟限制的广告投放或 IoT 等应用程序。
Amazon SageMaker Autopilot 能够简化整个过程,使机器学习更加轻松、快捷和透明。现在,您可以在没有深度机器学习知识的情况下构建分类和回归模型 – 只需提供表格式数据集并选择要预测的目标列,SageMaker Autopilot 就会自动探索具有不同的数据预处理器、算法和算法参数设置组合的机器学习解决方案,从而找到最准确的模型。无需您自己决定使用哪种算法,SageMaker Autopilot 会自动从其原生支持的高性能算法列表中选择合适的算法,然后对这些算法进行评估。SageMaker Autopilot 还会自动对这些算法尝试不同的参数设置,以获得最佳模型质量。现在,您只需单击一下即可直接将最佳模型部署到生产环境中,或评估多个候选模型以权衡对比准确性、延迟和模型大小等指标。您无需担心数据清理和预处理问题,因为 SageMaker Autopilot 在通过算法训练模型之前会自动对数据应用不同类型的数据预处理器。