亚马逊AWS官方博客
AWS 如何将机器学习送到每位开发者和BI分析师手中
今天,AWS 宣布推出了数种轻松地向应用程序和BI控制面板中添加机器学习预测能力的新方法。仅需在您的结构化查询语言 (SQL) 中添加一些语句,在Amazon QuickSight中进行几次点击,即能轻松使用您的 Amazon Aurora 数据库中的关系型数据或Amazon S3 中的非结构化数据,为应用程序和商业智能 (BI) 控制面板添加机器学习 (ML) 预测。Aurora、Amazon Athena 和 Amazon QuickSight 可以直接调用 Amazon SageMaker 和 Amazon Comprehend 等 AWS ML 服务,因此您无需从自己的应用程序中调用它们。这使得您可以以更直接的方式向应用程序添加 ML 预测,无需构建定制集成,来回复制数据,学习多种独立工具,编写多行复杂代码等等,甚至无需具备 ML 经验。
这些新的特性允许通过 SQL 查询和控制面板执行尖端的ML 预测,从而使 ML 变得更加实用,更方便数据库开发人员和商业分析师使用。在以前,您可能会耗费多日编写应用程序中定制代码,并需要考虑在生产环境中扩展、管理和支持。而现在,任何具备编写 SQL 能力的人,都可以在没有任何定制的”胶合代码”的情况下,在应用程序中构建和使用ML预测。
数据横流的世界
AWS 坚信,在不久的未来,每个应用程序均会融入 机器学习(ML) 和人工智能 (AI)。数万客户可通过 Amazon SageMaker 享受 ML 带来的好处。Amazon SageMaker 是一种完全托管服务,可以帮助数据科学家和开发人员轻松、快速地构建、训练和部署大规模 ML 模型。
虽然目前有多种可用于构建模型及通过易用 API (如 Amazon Comprehend)使应用程序智能化的方法,但要将这些模型整合到您的数据库、分析和商业智能报告中,依然面临着技术挑战。请考虑一个相对简单的客户服务示例。Amazon Comprehend 可以快速评估一段文字所表达的情绪(是积极的还是消极的?)。假设我在一家商店的客户服务页面留下这样一条反馈:“你的产品太差劲了,我不会再购买你的产品!” 商店根据用户反馈进行情绪分析,然后立即联系我试图作出弥补,这一系列工作对他们来说可能非常琐碎。尽管他们的数据库中有可用的数据,同时也有广泛的 ML 服务可用。
难点在于,构建预测流程需要在模型和应用程序之间移动数据。
在过去,开发人员被迫执行大量复杂的人工作业才能够获取这些预测,再将相关结果加入到更广泛的应用程序、流程或分析控制面板当中。相关工作包括,在向 ML 模型提交数据前,以及将预测结果提供给您的应用程序使用前,需要开发毫无价值的枯燥的应用程序级代码,用于在不同数据库和存储位置之间复制数据,转换各种数据格式。整个过程相当繁琐。这样的工作复杂累赘,浪费了开发人员的宝贵时间,且效率低下。此外,把数据库的数据移入和移出也会对安全造成压力,使管理变得更加复杂。
让机器学习成为每个开发人员手中的利器
在 AWS,我们有着明确的使命:我们致力于让机器学习成为每个开发人员的利器。让您更轻松地运用尖端的ML 服务,以帮助您提升业绩。不同规模的企业客户依赖于 Amazon SageMaker 和 Amazon Comprehend 等 AWS ML 服务,其中不乏 NFL、Intuit、AstraZeneca 和 Celgene 等企业。以 Celgene 为例,该公司使用 AWS ML 服务进行毒理学预测,通过虚拟方式分析潜在药物的生物学影响,不必让病患冒险试药。以前需要花上两个月时间训练的模型,现在只需要四个小时就能完成。
尽管 AWS 提供的 AI 和 ML 服务覆盖面最广、最深入,同时我们仅在 2018 年一年当中就推出了 200 余种机器学习功能和能力,但我们认为还需要更多。在各种各样的创新实践中,最佳的选择便是让您现有的人员能够直接具备ML生产力。
尤其是现有的开发人员和商业分析师。
尽管我们所提供了能够提高数据科学家们的工作效率的服务,但我们仍希望让更多的应用程序开发人员也可以使用完全云原生的 尖端ML 服务。有众多的客户使用 Aurora,同时也擅长使用 SQL 进行编程。我们认为,让您在此数据上运行机器学习预测才是最重要的,这样您可以在不影响既有的事务处理的情况下,获取创新的数据分析方式。您可以像之前一样针对您的业务数据使用 Amazon SageMaker 训练 ML 模型,然后运用 Aurora 或 Athena 的新能力,在一行 SQL 里利用该模型运行预测。这使得 ML 模型可供更多应用程序开发人员获取和使用。
销售线索评分就是一个好例子。例如,如果您基于 Aurora 构建一个 CRM 系统,那么您将会把所有的客户关系数据、市场触达和销售线索等信息保存到数据库中。当销售线索从网页上录入后,就会保存进Aurora,而您的销售团队则会对其进行跟进,将它们转化为真正的订单。
但要是您希望帮助您的销售团队加快处理效率,又该从何入手呢? 销售线索评分是一个预测模型。该模型有助于验证和评估新增的销售线索,让销售团队可以判断哪些最有可能转化为订单,从而提高团队的效能。您可以使用自己构建的模型,或者从 AWS机器学习市场(AWS ML Marketplace) 购买模型,将其部署到 Amazon SageMaker,再根据模型预测的优先级对所有销售队列进行排序。与过去不同的是,您不必编写任何胶合代码。
又或者,您可能想搭配使用这些服务实现一个最佳优惠的使用案例。例如,您的客户可能会致电您的呼叫中心进行投诉。客户服务代表成功解决了问题,继而向客户推荐新产品和服务。但要如何推荐产品和服务呢? 其实,该客户服务代表可以在显示多个视图和建议的 Amazon QuickSight 控制面板上拉取产品推荐。
第一个视图根据 Aurora 查询显示产品推荐。查询可拉取到客户资料、购物记录和产品目录,并调用 Amazon SageMaker 中的模型生成产品推荐。第二个视图显示了拉取到客户浏览历史或 S3 数据湖点击流数据的 Athena 查询,并调用 Amazon SageMaker 模型生成产品推荐。第三个视图显示了从第一个视图和第二个视图获取结果的 Amazon QuickSight 查询,调用 Amazon SageMaker 中的联合模型,然后生成产品推荐。现在您可以根据客户的不同意见提供多种优惠信息。所有信息都在一个控制面板中显示出来。
在 BI 分析师方面,我们经常听闻客户的挫败体验,即在从模型获取预测前必须先构建和管理预测管道。之前,开发人员需要花数天时间编写应用程序级代码,以在多个模型和应用程序之间来回移动数据。您现在可以选择弃用您的预测管道,改用 Amazon QuickSight 将您的所有 ML 预测可视化并作出报告。
对于应用程序开发人员和商业分析师来说,这些新特性使得他们可以以更直接的方式向应用程序添加 ML 预测,无需尝试构建定制集成,移动数据,学习多种独立工具,编写多行复杂代码等等,甚至在不具备 ML 经验的条件下也可以使用。如今您可以向 SQL 查询添加一些语句,在 Amazon QuickSight 中几次点击,即可完成过去占用开发人员多日的工作。
透过这些方式,我们让更多开发人员和数据分析师可以获取 ML 的强大力量,而无需博士学位的加持。
您可以访问 Aurora、Athena 和 Amazon QuickSight 页面了解更多信息。
关于作者
Matt Asay(发音:“Ay-see”)是 AWS 的一名首席专家,在各大开源和大数据公司累积了近二十年从业经验。您可以关注他的 Twitter 帐号 (@mjasay)。