亚马逊AWS官方博客

Category: Amazon Machine Learning

使用 Amazon Sumerian 和 Amazon Lex 构建 AR/AI 车辆使用手册

汽车厂商在车辆中不断增加新的功能、用户界面和人工智能特性。同时,也发布了各种用户使用手册,详细介绍如何使用这些功能。然而这些用户手册往非常繁琐,包含不同的语言,长度长达数百页。因此,车主常常难以搜索到与特定功能相关的信息。车厂也曾尝试使用视频或移动应用替代纸质手册,但并没有改进用户体验,很多车主仍然不知道如何充分利用了汽车厂商提供的所有创新功能。

Read More

使用 Amazon SageMaker Ground Truth 执行语义分割添加标签时自动分割对象

Amazon SageMaker Ground Truth 可帮助您快速构建高度准确的机器学习 (ML) 训练数据集。利用 Ground Truth,可以方便地找到您自己的人工标记工作者,并为他们提供用于常见添加标签任务的内置工作流和界面。此外,Ground Truth 还可以使用自动添加标签功能将添加标签的成本降低多达 70%,其中自动添加标签的工作原理是利用人工添加标签的数据来训练 Ground Truth,从而使这项服务学会独立为数据加标签。

Read More

使用 Amazon Comprehend 构建自定义分类器

Amazon Comprehend 是一项使用机器学习 (ML) 在文本中发现见解和关系的自然语言处理 (NLP) 服务。Amazon Comprehend 可识别文本的语言;提取关键短语、地点、人物、品牌或事件;以及理解文本的正面或负面程度。有关 Amazon Comprehend 所有功能的更多信息,请参阅 Amazon Comprehend 功能。

Read More

使用适用于 Amazon SageMaker 的 AWS Step Functions Data Science SDK 自动执行模型重新训练和部署

随着机器学习 (ML) 在公司核心业务中占据的份量越来越重,缩短从模型创建到部署的时间就变得越来越重要。2019 年 11 月,AWS 发布了适用于 Amazon SageMaker 的 AWS Step Functions Data Science SDK,开发人员可以通过这款开源开发工具包用 Python 创建基于 Step Functions 的机器学习工作流。现在,您可以使用与模型开发所用的同款工具创建可重复使用的模型部署工作流。您可以在 GitHub仓库的 “automate_model_retraining_workflow” 文件夹中找到此解决方案的完整手册。

Read More

Amazon Forecast 现在支持按您选择的分位数生成预测

Forecast 在 re:Invent 2018 大会上推出并从 2019 年 8 月起全面开放,是一项完全托管的服务,使用机器学习生成高度准确的预测,用户无需事先具备任何机器学习经验。Forecast 适用于十分广泛的用例,包括估算产品需求、供应链优化、能源需求预测、财务规划、劳动力规划、云基础设施使用量的计算以及流量需求预测等。

Read More

使用 Amazon SageMaker 降低机器学习的总体拥有成本并提高工作效率

总体拥有成本 (TCO) 通常是您会用于估计与比较 ML 成本的财务指标。本文针对Amazon SageMaker (这是一个用来构建、训练与部署 ML 模型的全托管服务)做了TCO分析,结果表明,它的 TCO 在三年时间里比其他方式如自己通过 Amazon EC2 或 Amazon EKS来建设要低 54%。我们的分析范围涵盖了从只有五位数据科学家的小团队到由 250 位数据科学家组成的超大型团队,结论是 Amazon SageMaker 能为各种规模大小不同的团队都提供更出色的 TCO。

Read More

使用 Amazon Textract 和 Amazon Comprehend Medical 实现无服务器化的医疗文档分析

在医学报告整理和内容提取的场景中,从业人员往往需要花费大量的时间进行内容阅读和关键字的提炼;Amazon Textract 结合 Amazon Comprehend Medical 的解决方案整体采用无服务器化架构,全自动化也提高整体效率。采用该解决方案,可以以秒级的效率提取出需要的内容;除此之外,该架构也大大降低了整体成本,架构中包含的所有服务都以实际使用计费。
Amazon Textract 是一个托管的 OCR(Optical Character Recognition) 服务,Amazon Comprehend Medical 是一个医疗语义分析的托管人工智能服务。通过 Amazon Textract 将医学报告和诊断报告的表单表格转化成序列化文档,通过 Amazon Comprehend Medical 对这些序列化文档进行分析并快速获取不同分类的信息。在 CRO(Clinical Research Organization) 等行业场景中,可以通过这个解决方案对医学研究、药物分析及诊断报告提供有效的帮助和补充。

Read More

平民数据科学在企业的落地实践(一)

本文主要介绍来自AWS APN合作伙伴KNIME的数据科学和机器学习平台,这是一个平民化的机器学习平台,可以帮助企业低门槛的快速落地机器学习的能力。KINME的平台和AWS的数据服务有很好的结合,无论是数据源还是数据处理。同时KNIME在Gartner 2019数据科学和机器学习平台的魔力象限中处于领导者地位,技术领先行业。
本文作为系列文章的第一篇,用Kaggle上的泰坦尼克号幸存预测案例向读者介绍KNIME平台的使用。

Read More

不到1美元!1小时内训练自己的中文词向量 – Amazon SageMaker BlazingText nothing is impossible

在这篇博客中将介绍如何使用AWS SageMaker的内置BlazingText算法,在一个小时内,用不到1美元的成本训练出包含4.5亿中文汉字的中文维基百科的词向量,为客户构建业务语言模型打下坚实基础。主要突出两个AWS优势:1 SageMaker内置BlazingText算法快速训练模型 2 Spot Instance 大幅降低成本。

Read More