亚马逊AWS官方博客

AWS 如何将机器学习送到每位开发者和BI分析师手中

今天,AWS 宣布推出了数种轻松地向应用程序和BI控制面板中添加机器学习预测能力的新方法。仅需在您的结构化查询语言 (SQL) 中添加一些语句,在Amazon QuickSight中进行几次点击,即能轻松使用您的 Amazon Aurora 数据库中的关系型数据或Amazon S3 中的非结构化数据,为应用程序和商业智能 (BI) 控制面板添加机器学习 (ML) 预测。Aurora、Amazon Athena 和 Amazon QuickSight 可以直接调用 Amazon SageMaker 和 Amazon Comprehend 等 AWS ML 服务,因此您无需从自己的应用程序中调用它们。这使得您可以以更直接的方式向应用程序添加 ML 预测,无需构建定制集成,来回复制数据,学习多种独立工具,编写多行复杂代码等等,甚至无需具备 ML 经验。

使用 AWS Data Exchange 和 Amazon SageMaker 构建机器学习工作流

得益于诸如 Amazon SageMaker 和 AWS Data Exchange 等云服务,现在实施机器学习 (ML) 比以往更加容易。本博文将介绍如何使用 AWS Data Exchange 和 Amazon SageMaker 构建模型,以预测纽约市餐厅的餐厅等级。我们使用 AWS Data Exchange中的数据集(包含 23372 个餐厅检查等级和分数)和 Amazon SageMaker中的线性学习器算法训练和部署模型。

使用 Amazon Sumerian 和 Amazon Lex 构建 AR/AI 车辆使用手册

汽车厂商在车辆中不断增加新的功能、用户界面和人工智能特性。同时,也发布了各种用户使用手册,详细介绍如何使用这些功能。然而这些用户手册往非常繁琐,包含不同的语言,长度长达数百页。因此,车主常常难以搜索到与特定功能相关的信息。车厂也曾尝试使用视频或移动应用替代纸质手册,但并没有改进用户体验,很多车主仍然不知道如何充分利用了汽车厂商提供的所有创新功能。

使用 Amazon SageMaker Ground Truth 执行语义分割添加标签时自动分割对象

Amazon SageMaker Ground Truth 可帮助您快速构建高度准确的机器学习 (ML) 训练数据集。利用 Ground Truth,可以方便地找到您自己的人工标记工作者,并为他们提供用于常见添加标签任务的内置工作流和界面。此外,Ground Truth 还可以使用自动添加标签功能将添加标签的成本降低多达 70%,其中自动添加标签的工作原理是利用人工添加标签的数据来训练 Ground Truth,从而使这项服务学会独立为数据加标签。

使用 Amazon Comprehend 构建自定义分类器

Amazon Comprehend 是一项使用机器学习 (ML) 在文本中发现见解和关系的自然语言处理 (NLP) 服务。Amazon Comprehend 可识别文本的语言;提取关键短语、地点、人物、品牌或事件;以及理解文本的正面或负面程度。有关 Amazon Comprehend 所有功能的更多信息,请参阅 Amazon Comprehend 功能。

使用适用于 Amazon SageMaker 的 AWS Step Functions Data Science SDK 自动执行模型重新训练和部署

随着机器学习 (ML) 在公司核心业务中占据的份量越来越重,缩短从模型创建到部署的时间就变得越来越重要。2019 年 11 月,AWS 发布了适用于 Amazon SageMaker 的 AWS Step Functions Data Science SDK,开发人员可以通过这款开源开发工具包用 Python 创建基于 Step Functions 的机器学习工作流。现在,您可以使用与模型开发所用的同款工具创建可重复使用的模型部署工作流。您可以在 GitHub仓库的 “automate_model_retraining_workflow” 文件夹中找到此解决方案的完整手册。

Amazon Forecast 现在支持按您选择的分位数生成预测

Forecast 在 re:Invent 2018 大会上推出并从 2019 年 8 月起全面开放,是一项完全托管的服务,使用机器学习生成高度准确的预测,用户无需事先具备任何机器学习经验。Forecast 适用于十分广泛的用例,包括估算产品需求、供应链优化、能源需求预测、财务规划、劳动力规划、云基础设施使用量的计算以及流量需求预测等。

使用 Amazon SageMaker 降低机器学习的总体拥有成本并提高工作效率

总体拥有成本 (TCO) 通常是您会用于估计与比较 ML 成本的财务指标。本文针对Amazon SageMaker (这是一个用来构建、训练与部署 ML 模型的全托管服务)做了TCO分析,结果表明,它的 TCO 在三年时间里比其他方式如自己通过 Amazon EC2 或 Amazon EKS来建设要低 54%。我们的分析范围涵盖了从只有五位数据科学家的小团队到由 250 位数据科学家组成的超大型团队,结论是 Amazon SageMaker 能为各种规模大小不同的团队都提供更出色的 TCO。

通过 AWS Lake Formation FindMatches 转换匹配患者记录

患者匹配是实现医疗护理互通性的主要障碍之一。不匹配的患者记录和无法检索患者历史信息可能严重阻碍做出正确的临床决定,并导致漏诊或治疗延误。另外,医疗护理提供者经常会花精力去处理患者重复数据的删除,尤其当他们的数据库中的患者记录数量急速增加时。电子健康记录 (EHR) 近年来大幅优化了患者的安全和护理协调,但准确的患者匹配对很多医疗护理组织来说仍然是一项挑战。