基于 AWS Inferentia 的 Amazon EC2 Inf1 实例现已在美国东部（俄亥俄）、欧洲（法兰克福、爱尔兰）和亚太地区（悉尼、东京）区域推出

发布于: Aug 13, 2020

AWS 扩展了 Amazon EC2 Inf1 实例的提供范围，现已包括美国东部（俄亥俄）、欧洲（法兰克福、爱尔兰）和亚太地区（悉尼、东京）区域Inf1 实例由 Amazon 自定义设计的 AWS Inferentia 芯片提供支持，在云中的单位推理成本极低，并且让开发人员日常大规模使用机器学习的门槛也较低。

与基于同类 GPU 的实例相比，Inf1 实例的吞吐量高 30%，且单位推理成本降低可达 45%，非常适合图像识别、自然语言处理、个性化和异常检测等应用程序。开发人员可以使用 AWS Neuron 开发工具包将其机器学习模型部署到 Inf1 实例，该开发工具包集成了 TensorFlow、PyTorch 和 MXNet 等受欢迎的机器学习框架。它包含一个编译器、一个运行时和各种分析工具，可优化 AWS Inferentia 的推理性能。

随着在更多区域推出，Inf1 实例现已在美国东部（弗吉尼亚北部、俄亥俄）、美国西部（俄勒冈）、欧洲（法兰克福、爱尔兰）以及亚太地区（悉尼、东京）等 AWS 区域开放。Inf1 实例有四种尺寸供选择，最多包含 16 个Inferentia 芯片，可提供每秒多达 2000 万亿次运算 (TOPS) 的吞吐量以及高达 100 Gbps 的网络带宽。它们可按需作为预留实例、Spot 实例或者在 Savings Plans 中购买。

开始使用 Inf1 实例的最简单和最快速的方法是通过 Amazon SageMaker，这是一个完全托管的服务，用于构建、训练和部署机器学习模型。希望自行管理机器学习应用程序开发平台的开发人员可以通过包括 Neuron SDK 的 AWS Deep Learning AMI 启动 Inf1 实例开始使用，也可以通过适用于容器化 ML 应用程序的 Amazon Elastic Kubernetes Service (EKS) 或 Amazon Elastic Container Service (ECS) 来使用 Inf1 实例。

要了解更多信息，请访问 Amazon EC2 Inf1 实例页面。

基于 AWS Inferentia 的 Amazon EC2 Inf1 实例现已在美国东部（俄亥俄）、欧洲（法兰克福、爱尔兰）和亚太地区（悉尼、东京）区域推出

终止对 Internet Explorer 的支持