发布于: Aug 13, 2021
AWS Neuron 是在基于 AWS Inferentia 的 Amazon EC2 Inf1 实例上运行机器学习软件开发工具包,现在支持 TensorFlow 2。从 Neuron 1.15.0 开始,您可以在 Inf1 实例上执行基于 TensorFlow 2 BERT 的模型,对其他模型的支持很快也将推出。如需了解关于 Neuron TensorFlow 2 支持的更多信息,请访问 TensorFlow 2 FAQ 页面。
我们还通过新文档更新了我们的资源,包括帮助您上手 TensorFlow 2的教程、指导您如何在 Inferentia 上利用 AWS Sagemaker 托管部署 HuggingFace BERT 模型容器的教程、帮助您比较和复制结果的推理性能页面,以及帮助您揭示在 Inferentia 上表现极为出色的深度学习架构类型的新应用说明。
AWS Neuron 可与常用的 ML 框架原生集成,例如 TensorFlow、PyTorch 和 Apache MXNet。它包括深度学习编译器、运行时以及帮助您为应用发掘最佳性能的工具。如需了解更多信息,请访问 AWS Neuron 页面和 AWS Neuron 文档。
Amazon EC2 Inf1 实例提供最低成本的云中深度学习推理,目前已在全球 23 个区域推出,包括美国东部(弗吉尼亚北部、俄亥俄)、美国西部(俄勒冈、加利福尼亚北部)、AWS GovCloud(美国东部、美国西部)、加拿大(中部)、欧洲(法兰克福、爱尔兰、伦敦、米兰、巴黎、斯德哥尔摩)、亚太地区(香港、孟买、首尔、新加坡、悉尼、东京)、中东(巴林)、南美洲(圣保罗)和中国(北京、宁夏)。在最能满足您对机器学习推理的实时延迟需求的区域,您可以使用 Amazon EC2 Inf1 实例。要了解更多信息,请访问 Amazon EC2 Inf1 实例页面。