亚马逊AWS官方博客

机器学习为数字化转型插上翅膀

 “Machine learning is going to result in a real revolution.”

“机器学习将带来真正的革命。” –Greg Papadopoulos

 

AWS 首席执行官 Andy Jassy在re:Invent技术大会主题演讲中,围绕着转型从六个方面做了阐述:1、领导层协调一致;2、技术的深度和广度;3、架构和应用的现代化;4、规模化使用数据;5、采用机器学习创新;6、突破云迁移的阻碍。今天我和您分享第五部分,讲讲企业如何可以通过云上的机器学习创新,帮助你数字化转型插上腾飞的翅膀。

 

新冠疫情加速了全球范围内企业数字化转型的步伐。优秀的企业正在快速创建数字化服务体系,通过向云迁移,敏捷地实现创新转型,以加速业务发展和提高客户满意度。机器学习无疑是其中一项关键技术,它开始被广泛应用于各行业各类型的企业系统应用中,帮助企业增强客户体验,改善运营决策,提供创新的产品和服务。

亚马逊有数千名工程师, 通过使用机器学习来推进企业的全方位的数字化转型,推出了智能音箱Amazon Echo,无人值守商店Amazon Go,运营中心机器人,无人送货机器人和直升机等众多商业创新。这一些产品和业务的背后,都离不开AWS机器学习服务的支持。在过去几年中,AWS 在机器学习领域做了大量尝试和努力,推出了一系列机器学习服务,旨在把机器学习的能力交到每一位创建者手中,帮助企业通过机器学习发掘数据中的价值,实现业务流程的自动化和优化, 提供创新的产品、服务和功能,全球数万的客户选择使用 AWS 运行机器学习工作负载。据统计,目前云上80%的机器学习工作负载运行在AWS上。

AWS 拥有覆盖机器学习堆栈的所有三个层的机器学习服务和功能。在机器学习框架方面,AWS 支持各种主流的机器学习基础框架和标准接口,比如 TensorFlow、PyTorch、Apache MXNet、Gluon、Keras 等;也支持 AWS Glue、Amazon Kinesis 等数据接口。我们与研究开发人员和数据科学家交谈发现,90% 的数据科学家都在使用多种框架。因此我们对三种主要框架都提供良好的支持,并且设有三支专门团队,分别专门从事 TensorFlow、PyTorch 和 MXNet 工作。这种做法带来了与众不同的结果,让 AWS 成为了运行所有流行机器学习框架的最佳场所。在云中运行的 TensorFlow 有 85% 运行在 AWS 上,PyTorch有 83% 运行在 AWS 上。

 

在基础设施方面,AWS 提供各种各样机器学习的虚机、实例和镜像,提供 GPU 的计算实例 Amazon EC2 G4,也提供 Amazon EC2 P3 这样专门做并行计算、适合机器学习计算的实例类型,还推出了 Amazon Elastic Inference,在 Amazon EC2 上动态地挂一个专门的 GPU,然后自动缩放,以比较低的成本来做机器学习推理工作。AWS 还推出了基于自家创新芯片的 AWS Inferentia 的 Amazon EC2 Inf1 实例,专门用于机器学习推理。上周英伟达宣布推出了性能强大的NVIDIA A100 GPU芯片的当天, AWS宣布将同步推出对应的EC2实例。

世界上优秀的机器学习专家仍是凤毛麟角,为了让机器学习实现全面普及,我们必须做到让机器学习更加易于使用。在堆栈的中间层,我们构建了Amazon SageMaker,这款面向日常开发人员和数据科学家的完全托管式的机器学习服务。SageMaker 是一款颠覆性的产品,帮助开发人员和数据科学家轻松构建、训练、调优和部署机器学习模型。我们在两年半前推出了 SageMaker,并在之后不断推出创新。

去年我们发布了超过 50 种功能,让使用机器学习变得更轻松。例如,我们引入了 SageMaker Ground Truth,它可以帮助您在标记数据时事半功倍。在 AWS Marketplace 中,您可以找到由其他用户提供的数百种可用于您的机器学习的算法。我们是将强化学习构建到 SageMaker 等服务中的先行者,AWS还推出了独具创意的 DeepLens,DeepRacer 和DeepComposer等产品服务,帮助用户通过图像识别、自动赛车和音乐作曲,学习使用深度学习,增强学习和生成式AI。您可以使用 Spot 实例进行一键式训练,帮助您节省多达 90% 的费用。我们构建了 SageMaker Neo,让您只需通过一次训练,就能在边缘上几乎任何想位置进行编译运行。

 

我们推出了新的 Amazon SageMaker Studio,这是第一个适用于机器学习的完全集成的开发环境 (IDE)。SageMaker Studio 是基于 Web 的 IDE,让您可以在一个位置集中存储和收集所需的所有内容,包括代码、笔记本、数据集、设置和项目文件夹。

 

SageMaker Studio 的部分新功能包括: SageMaker Notebook 是具有弹性计算功能的一键式笔记本,让您无需预配置实例即可在几秒钟内快速启 动笔记本。SageMaker Experiments 让您能够自动捕获、组织和搜索用于构建、训练和调优模型的每个步骤。SageMaker Debugger 让开发人员可以调试和分析模型训练,从而提高机器学习模型的准确性。SageMaker Model Monitor 可以让您通过监控部署到生产中的模型,实现概念偏差的自动检测。SageMaker Autopilot 是一款提供全方位掌控力和可见性的自动机器学习。

 

我们非常高兴,上个月在中国北京区域和宁夏区域,我们已正式推出了Amanzon SageMaker和SageMaker Studio。 中国的两个区成为全球24个区域中第5和第6个发布SageMaker Studio的区域。

 

我们将机器学习堆栈的顶层称为AI 服务,因为这些服务拥有模仿人类认知的能力,而我们拥有广泛的 AI 服务。在视觉方面,我们推出了 Amazon Rekognition。在语音方面,Amazon Polly 提供文本到语音转换功能,Amazon Transcribe 可用于记录语音的内容,这两项服务在中国已经向用户提供。在文本方面,Amazon Translate 可以将转录后的文本翻译成多种语言。我们的 OCR++ 服务 Amazon Textract 不仅能够识别印刷品上的信息,而且还能识别复杂的公式、表格和图形中的信息。我们在 Alexa 中采用了自然语言理解和自动语音识别功能,通过 Amazon Lex 服务将这些功能提供给您。

 

在2018年 re:Invent 大会上,我们还推出了提供深度定制化服务的 Amazon Personalize 以及提供预测服务的 Amazon Forecast。而在2019年的re:Invent上,我们推出了 Amazon Fraud Detector,这项机器学习服务帮助您进行欺诈管理。我们发布了 Amazon CodeGuru,这项机器学习服务可以自动执行代码评审并找出最有价值的代码行。亚马逊内部有 80000 个应用程序正在使用CodeGuru,此服务已为我们节省了数千万美元。我们构建了 Contact Lens for Amazon Connect,一项适用于 Amazon Connect 的机器学习支持的联络中心分析服务,它会自动转录并分析客户来电内容,并支持搜索文本中的关键词和特定短语,还能通过分析对话中较长的静默期或通话方的交谈方式等内容来进行情绪分析。我们还构建了 Amazon Kendra,可以通过机器学习和自然语言处理来重塑企业搜索位于企业内部不同位置的不同数据,让您从企业内部所有数据中获得的价值。最近Amazon Kendra已在全球正式上线。

 

机器学习不是一两项服务,企业需要在机器学习堆栈的所有三层中都拥有高度安全、高度可靠、功能完善的数据存储,以及适当的访问控制、适当的安全性、最广泛的分析集以及真正可靠的产品及服务。我们相信将来大多数具有现代技术能力的公司都会在该堆栈的所有三个层的框架中运行。在这方面,AWS将成为你最好的帮手。 欢迎您联系我们。

 

本篇作者

张侠

张侠博士现任亚马逊AWS首席云计算企业战略顾问,帮助大中华区的企业利用云计算技术进行业务创新和数字化转型,利用云的力量交付关键的企业级系统,部署创新的解决方案,满足业务成长的需求。
张侠有逾二十年在北美和中国从事信息技术研发、业务拓展和企业信息架构和IT管理的经验。他在云计算、大数据、人工智能、移动互联网、社交网络等方面拥有丰富的经验,可以帮助客户利用这些经验,采用创新技术,创造业务价值。