亚马逊AWS官方博客
面向业务分析师的全新实践课程 — 在 AWS 上使用无代码 ML 做出实际决策
人工智能(AI)无处不在。AI 会将某些电子邮件发送到我们的垃圾邮件文件夹。它具有自动更正功能,可帮助我们在发短信时修正拼写错误。现在,我们可以使用它来解决业务问题。
在商业领域,数据驱动的见解变得越来越有价值。这些见解通常是在机器学习(ML)的帮助下发现的,机器学习(ML)是人工智能的一个子集,也是复杂 AI 系统的基础。而且 ML 技术已经经过长时间的发展。如今,您无需成为数据科学家或计算机工程师即可获得见解。借助 Amazon SageMaker Canvas 等无代码机器学习工具,您现在无需编写任何代码即可使用机器学习实现有效的业务成果。您可以更好地了解模式、趋势以及将来可能发生的事情。这意味着做出更好的商业决策!
今天,我很高兴地宣布,AWS 和 Coursera 将推出新的实践课程在 AWS 上使用无代码 ML 做出实用决策。这个时长五小时的课程旨在揭开 AI/ML 的神秘面纱,让任何拥有电子表格的人都能够解决现实生活中的业务问题。
课程要点
在三节课中,您将学习如何使用机器学习解决业务问题、如何在不使用任何代码的情况下构建和理解 ML 模型,以及如何使用 ML 发掘价值以做出更好的决策。每节课都会引导您使用 Amazon SageMaker Canvas(一种可视化的、无代码的机器学习工具)完成真实的业务场景和实践练习。
第 1 课 — 如何使用 ML 解决您的业务问题
在第一课中,您将学习如何在不了解数据科学的情况下使用机器学习解决业务问题。您将能够描述分析的四个阶段,并讨论 AI/ML 的高级概念。
本课还将向您介绍自动机器学习(AutoML)以及 AutoML 如何帮助您根据常见业务使用场景生成见解。然后,您将练习围绕最常见的机器学习问题类型提出业务问题。
例如,假设您是一家票务公司的业务分析师。您负责管理大型场所(音乐会、体育赛事等)的门票销量。假设您想预测现金流。使用 ML 可以解决的一个问题可能是:“如何更好地预测门票销量?” 这是时间序列预测的示例。您还将在整个课程中探讨数字和类别 ML 问题。它们将帮助您回答诸如“客户可能的年收入是多少?”之类的业务问题和“这位顾客会在接下来的三个月内再次买票吗?”。
接下来,您将学习为机器学习提出问题的迭代过程,以使问题更加明确,并探索如何选择最有价值的问题加以解决。
第一课最后将深入探讨时间如何影响预测和非预测业务问题中的数据,以及如何为每种 ML 问题类型设置数据。
第 2 课 — 无需任何代码即可构建和理解 ML 模型
在第二课中,您将学习如何使用 Amazon SageMaker Canvas 在没有任何代码的情况下构建和理解机器学习模型。您将重点介绍一个客户流失示例,其中包含来自蜂窝服务公司的综合生成数据。问题是,“哪些客户最有可能在下个月取消服务?”
您将学习如何导入数据并开始探索。本课将解释如何选择正确的配置、选择目标列以及如何为 ML 准备数据。
SageMaker Canvas 最近还推出了用于探索性数据分析(EDA)的新可视化图表,包括散点图、条形图和箱形图。这些可视化图表可帮助您分析数据集中特征之间的关系并更好地理解您的数据。
完成最终数据验证后,您就可以预览模型了。这将立即显示模型的准确性,以及平均而言,哪些特征或列对模型预测的相对影响力最大。准备和验证完数据后,就可以继续构建模型了。
接下来,您将学习如何评估模型的性能。您将能够描述训练数据和测试数据拆分之间的区别,以及如何使用它们来得出模型的准确度得分。本课还讨论了其他性能指标,以及如何运用领域知识来确定模型的性能是否良好。一旦了解如何评估性能指标,您就为做出更好的业务决策奠定了基础。
第二课总结了一些需要注意的常见问题,并展示了如何迭代模型以不断提高性能。您将能够描述由于记忆与泛化以及要避免的其他模型缺陷而导致的数据泄漏的概念。您还将学习如何迭代问题、所含特征和样本量,以不断提高模型性能。
第 3 课 — 从 ML 中挖掘价值
在第三课中,您将学习如何从机器学习中挖掘价值以做出更好的决策。您将能够生成和读取预测,包括电子表格中单行上的预测(称为单个预测)和整个电子表格上的预测(称为批量预测)。您将能够了解影响预测的因素并玩不同的场景。
接下来,您将学习如何与他人分享见解和预测。您将学习如何从产品中生成视觉图表,例如功能重要性图表或评分图,并通过演示文稿或业务报告分享见解。
第三课总结了如何与数据科学团队或具有机器学习专业知识的团队成员协作。使用 SageMaker Canvas 构建模型时,可以选择快速构建或标准构建。快速构建通常需要 2-15 分钟,并且输入数据集限制为最多 50,000 行。标准构建通常需要 2-4 个小时,其准确度通常更高。SageMaker Canvas 可以轻松共享标准构建模型。在此过程中,您可以揭示模型幕后的复杂性,直至代码级别。
打开经过训练的模型后,可以单击共享按钮。这将创建一个可以在数据科学团队使用的集成开发环境 SageMaker Studio 中打开的链接。
在 SageMaker Studio 中,您可以看到输入数据集的转换以及有关评分和构件(如模型对象)的详细信息。您还可以查看用于数据探索和特征工程的 Python 笔记本。
实践练习
本课程包括七个实践实验室,可将您学到的知识付诸实践。您将有机会在 SageMaker Canvas 上使用无代码机器学习来解决基于公开数据集的现实挑战。
这些实验室侧重于各行各业的不同业务问题,包括零售业、金融服务业、制造业、医疗保健和生命科学,以及运输和物流。
您将有机会进行客户流失预测、房价预测、销售预测、贷款预测、糖尿病患者再入院预测、机器故障预测和供应链准时交付预测。
立即注册
在 AWS 上使用无代码 ML 做出实用决策是一堂时长五小时的课程,适用于业务分析师以及任何想学习如何使用无代码 ML 解决现实业务问题的人员。
立即在 Coursera 注册在 AWS 上使用无代码机器学习做出实用决策!
– Antje