发布于: Jun 25, 2021
Amazon EC2 Inf1 实例和 AWS Neuron 现已支持 YOLOv5 和 ResNext 深度学习模型以及最新的开源 Hugging Face Transformers。我们还优化了 Neuron 编译器以提高性能。相比于类似的基于 GPU 的实例,您现在可以通过预训练的 BERT 基础模型获得高出 12 倍的开箱即用吞吐量。这些改进可以有效地满足您的高性能推理需求,帮助您以低成本部署最先进的深度学习模型。
Amazon EC2 Inf1 实例由 AWS Inferentia 提供支持,后者是 AWS 推出的一款用于加速机器学习推理的定制芯片。这些实例可以将在云端进行深度学习推理的成本降到最低。您可以在 TensorFlow、PyTorch 和 MXNet 等热门机器学习框架上轻松地训练机器学习模型,并使用 Neuron SDK 将它们部署在 EC2 Inf1 实例上。许多热门的机器学习框架已经集成了 Neuron,因此您只需改动少量代码即可将现有模型部署到 Inf1 实例上。这使您可以自由保持硬件的可移植性并享受最新的技术,同时免受特定供应商解决方案的束缚。
Inf1 实例已经广泛应用于客户(如 Snap、Autodesk 和 Conde Nast)及 Amazon 服务(例如 Alexa、Rekognition),并已在全球 23 个 AWS 区域提供。我们在工程上的投资,辅以我们的公司规模以及久经考验的管理能力,使我们能够抓住任何节约成本的机会并让客户从中受益。为了帮助您进一步扩展在 Amazon EC2 Inf1 实例上运转的深度学习应用程序的规模,我们宣布从 2021 年 6 月 1 日起将按需 (OD) 价格下调 38%。对于想通过 Savings Plans 或预留实例 (RI) 进一步降低成本的客户,我们将 1 年期 Savings Plan 和 RI 的价格下调 38%,将 3 年期 Savings Plan 和 RI 的价格下调 31%。通过容器编排服务(如 Amazon ECS 或 EKS),使用 EC2 Inf1 实例的客户也可享受优惠价格。
对于希望使用完全托管式机器学习服务的客户,我们还降低了 Amazon SageMaker 中 ml.Inf1 实例的价格。 Amazon SageMaker 是一项完全托管式服务,可以帮助开发人员和数据科学家构建、训练和部署机器学习模型。自 2021 年 6 月 1 日起,Amazon SageMaker 客户使用按需实例 (OD) 的价格下调 38%。从今天起,Amazon SageMaker 1 年期 Savings Plam 的价格下调高达 38%,3 年期 Savings Plan 的价格下调高达 25%。价格的降低进一步提高了 Inf1 实例的性价比,可更好地满足您的实时推理需求。请访问 Amazon SageMaker 定价页面,了解 Amazon SageMaker 中 ml.Inf1 实例的价格。
Amazon EC2 Inf1 实例目前已在全球 23 个区域推出,包括美国东部(弗吉尼亚北部、俄亥俄)、美国西部(俄勒冈、加利福尼亚北部)、AWS GovCloud(美国东部、美国西部)、加拿大(中部)、欧洲(法兰克福、爱尔兰、伦敦、米兰、巴黎、斯德哥尔摩)、亚太地区(香港、孟买、首尔、新加坡、悉尼、东京)、中东(巴林)、南美洲(圣保罗)和中国(北京、宁夏)。在最能满足您对机器学习推理的实时延迟需求的区域,您可以使用 Amazon EC2 Inf1 实例,从而进一步优化性能并降低成本。
要了解更多信息,请访问 Amazon EC2 Inf1 实例页面。