Amazon EC2 Inf1 实例 – 新功能、更高性能、更低价格

发布于: Jun 25, 2021

Amazon EC2 Inf1 实例和 AWS Neuron 现已支持 YOLOv5 和 ResNext 深度学习模型以及最新的开源 Hugging Face Transformers。我们还优化了 Neuron 编译器以提高性能。相比于类似的基于 GPU 的实例，您现在可以通过预训练的 BERT 基础模型获得高出 12 倍的开箱即用吞吐量。这些改进可以有效地满足您的高性能推理需求，帮助您以低成本部署最先进的深度学习模型。

Amazon EC2 Inf1 实例由 AWS Inferentia 提供支持，后者是 AWS 推出的一款用于加速机器学习推理的定制芯片。这些实例可以将在云端进行深度学习推理的成本降到最低。您可以在 TensorFlow、PyTorch 和 MXNet 等热门机器学习框架上轻松地训练机器学习模型，并使用 Neuron SDK 将它们部署在 EC2 Inf1 实例上。许多热门的机器学习框架已经集成了 Neuron，因此您只需改动少量代码即可将现有模型部署到 Inf1 实例上。这使您可以自由保持硬件的可移植性并享受最新的技术，同时免受特定供应商解决方案的束缚。

Inf1 实例已经广泛应用于客户（如 Snap、Autodesk 和 Conde Nast）及 Amazon 服务（例如 Alexa、Rekognition），并已在全球 23 个 AWS 区域提供。我们在工程上的投资，辅以我们的公司规模以及久经考验的管理能力，使我们能够抓住任何节约成本的机会并让客户从中受益。为了帮助您进一步扩展在 Amazon EC2 Inf1 实例上运转的深度学习应用程序的规模，我们宣布从 2021 年 6 月 1 日起将按需 (OD) 价格下调 38%。对于想通过 Savings Plans 或预留实例 (RI) 进一步降低成本的客户，我们将 1 年期 Savings Plan 和 RI 的价格下调 38%，将 3 年期 Savings Plan 和 RI 的价格下调 31%。通过容器编排服务（如 Amazon ECS 或 EKS），使用 EC2 Inf1 实例的客户也可享受优惠价格。

对于希望使用完全托管式机器学习服务的客户，我们还降低了 Amazon SageMaker 中 ml.Inf1 实例的价格。 Amazon SageMaker 是一项完全托管式服务，可以帮助开发人员和数据科学家构建、训练和部署机器学习模型。自 2021 年 6 月 1 日起，Amazon SageMaker 客户使用按需实例 (OD) 的价格下调 38%。从今天起，Amazon SageMaker 1 年期 Savings Plam 的价格下调高达 38%，3 年期 Savings Plan 的价格下调高达 25%。价格的降低进一步提高了 Inf1 实例的性价比，可更好地满足您的实时推理需求。请访问 Amazon SageMaker 定价页面，了解 Amazon SageMaker 中 ml.Inf1 实例的价格。

Amazon EC2 Inf1 实例目前已在全球 23 个区域推出，包括美国东部（弗吉尼亚北部、俄亥俄）、美国西部（俄勒冈、加利福尼亚北部）、AWS GovCloud（美国东部、美国西部）、加拿大（中部）、欧洲（法兰克福、爱尔兰、伦敦、米兰、巴黎、斯德哥尔摩）、亚太地区（香港、孟买、首尔、新加坡、悉尼、东京）、中东（巴林）、南美洲（圣保罗）和中国（北京、宁夏）。在最能满足您对机器学习推理的实时延迟需求的区域，您可以使用 Amazon EC2 Inf1 实例，从而进一步优化性能并降低成本。

要了解更多信息，请访问 Amazon EC2 Inf1 实例页面。

Amazon EC2 Inf1 实例 – 新功能、更高性能、更低价格

终止对 Internet Explorer 的支持