宣布推出 Amazon EC2 Inf1 实例，可在云端提供高性能和最低成本的机器学习推理

发布于: Dec 3, 2019

今天，我们宣布正式推出 Amazon EC2 Inf1 实例，该实例的构建目的就是用于支持机器学习推理应用程序。Inf1 实例具有多达 16 个 AWS Inferentia 芯片，这是由 AWS 专门设计和打造的高性能机器学习推理芯片。此外，我们还将 Inferentia 芯片与最新的第二代定制 Intel® Xeon® 可扩展处理器与高达 100Gbps 的网络相结合，以实现高吞吐量推理。这一强大的配置使 Inf1 实例提供 Amazon EC2 G4 实例 3 倍的吞吐量，每次推理的成本降低高达 40%，而 Amazon EC2 G4 实例先前一直是云端机器学习推理的最低成本实例。

Amazon EC2 Inf1 实例可在云端提供高性能和更低成本的机器学习推理。借助 Inf1 实例，客户可以在云中以更低的成本运行大规模机器学习推理应用程序，例如图像识别、语音识别、自然语言处理、个性化和欺诈检测。

AWS 使您可以轻松地在 Amazon EC2 Inf1 实例上部署机器学习应用程序。训练好模型后，您可以使用 AWS Neuron，这是一种使用 AWS Inferentia 芯片运行推理的软件开发工具包，由编译器、运行时和性能分析工具组成。Neuron 已预先集成到常用机器学习框架中，其中包括 TensorFlow、Pytorch 和 MXNet，以提供最佳性能的 EC2 Inf1 实例。可以使用 AWS Deep Learning AMI 部署 Inf1 实例，并可通过托管服务（例如 Amazon SageMaker、EKS 和 ECS）使用 Inf1 实例。

Amazon EC2 Inf1 实例有 4 种大小，并且在美国东部（弗吉尼亚北部）和美国西部（俄勒冈）AWS 区域作为按需实例、预留实例、Spot 实例或 Savings Plan 的一部分提供。要了解有关 Inf1 实例的更多信息，请访问 Inf1 页面。

宣布推出 Amazon EC2 Inf1 实例，可在云端提供高性能和最低成本的机器学习推理

终止对 Internet Explorer 的支持