亚马逊AWS官方博客

re:Invent 2020 博客直播:Werner Vogels 主题演讲

12 月 15 日星期二,Werner Vogels 博士将发表主题演讲,分享 Amazon 如何解决当今世界最棘手的技术问题,机会难得,切勿错过。Jeff Barr、Martin Beeby、Steve Roberts 和 Channy Yun 将通过博客直播本次活动,分享来自 re:Invent 2020 最后一个主题演讲的所有亮点、见解和主要公告。

Read More

新功能 — 使用 Amazon SageMaker 功能库,存储、发现和共享机器学习功能

今天,我非常高兴地宣布 Amazon SageMaker 功能库,一项 Amazon SageMaker 新功能,它可以使数据科学家和机器学习工程师轻松安全地存储、发现和共享培训和预测工作流程中使用的精选数据。
对于选择正确算法来培训机器学习 (ML) 模型的重要性,经验丰富的从业人员知道提供高质量数据有多么重要。清理数据是很好的第一步,机器学习工作流程通常包括填充缺失值、删除异常值等步骤。然后,他们经常使用被称为“特征工程”的常见技术和难懂的技术进行数据转换。

Read More

Amazon HealthLake 在云中存储、转换和分析健康数据

医疗保健组织每天收集大量患者信息,从家族史和临床观察,到诊断和药物治疗。他们使用所有这些数据来尝试编译患者健康信息的完整图像,以提供更好的医疗保健服务。目前,这些数据分布在各种系统(电子病历、实验室系统、医疗图像存储库等)之间,并以数十种不兼容的格式存在。

Read More

芯片设计-如何在缺少 CAD 团队的情况下进行异常日志分析

国内大部分半导体设计公司都面临缺少CAD工程师的局面。缺少CAD团队影响设计效率成为一个日益显著的问题。缺少CAD团队意味着缺少开发设计流程工具,缺乏流程管理,无法为作业失败后的日志分析提供良好的排查指导。本文以回归测试举例,阐述在回归测试过程中,当作业失败,需要针对异常状况进行分析时,提供一个简单的排查流程指导。各位可以根据公司自身的状况进行定制化设计,并通过异常分析流程在缺少CAD团队的情况下提升开发效率。

Read More

新功能 – Amazon SageMaker 中的托管数据并行简化了大型数据集上的训练

随着数据集和模型的规模越来越大、越来越复杂,从事大型分布式训练作业的机器学习 (ML) 从业人员不得不面临越来越长的训练时间,即使在使用 Amazon Elastic Compute Cloud (EC2) p3 和 p4 实例等强大的实例时也是如此。举例来说,使用配备 8 个 NVIDIA V100 GPU 的 ml.p3dn.24xlarge 实例时,需要 6 个多小时在公开可用的 COCO 数据集上训练高级对象检测模型,例如 Mask RCNN 和 Faster RCNN。同样地,在相同实例上训练最新自然语言处理模型 BERT 需要 100 多个小时。我们的一些客户,例如自动驾驶汽车公司,经常要在大型 GPU 集群上处理运行数天的更大型训练作业。
可以想象,这些长时间的训练是机器学习项目的严重瓶颈,影响了生产效率并减缓了创新。客户向我们寻求帮助,而后我们就行动了。

Read More