David Fan | 亚马逊AWS官方博客

Tag: David Fan

使用 Amazon Elastic Inference 降低 Amazon EC2 for PyTorch 模型的推理成本

Elastic Inference 是一项灵活的低成本解决方案，适用于 Amazon EC2 上的 PyTorch 推理工作负载。通过将 Elastic Inference 加速器附加到 CPU 客户端实例，您可以获得类似于 GPU 的推理加速并保持比独立的 GPU 和 CPU 实例更高的成本效益。有关更多信息，请参阅什么是 Amazon Elastic Inference？

亚马逊AWS官方博客

Tag: David Fan

使用 Amazon Elastic Inference 降低 Amazon EC2 for PyTorch 模型的推理成本

了解

资源

开发人员

帮助