亚马逊AWS官方博客

Category: Compute*

基于ECS的容器日志解决方案

ECS是AWS发布的容器集群管理和调度服务。通过ECS容器集群管理服务,用户可以很方便地管理成百上千个容器组成的业务系统,而无需运维容器集群管理、调度及状态存储等相关管理组件。相比于虚拟机,容器技术拥有诸多优势,使得近年来越来越多的用户选择拥抱容器技术。

Read More

国际消费电子展 (CES) 上的 AWS IoT、Greengrass 和 Machine Learning 车联网应用介绍

上周,我参加了总部位于西雅图的 INRIX 公司总裁 Bryan Mistele 的一场演讲。Bryan 的演讲围绕交通运输的四大主要属性(通常用缩写形式 ACES 表示),展望了交通运输业的未来: 自主化 – 汽车和卡车将获得扫描和感测环境的能力,能够在无需人为输入的情况下进行导航。 互连化 – 所有类型的汽车都将能够利用与其他汽车以及与基于云的资源之间的双向连接(始终连接或间歇连接)。它们可以上传路况和性能数据、彼此通信,从而以车队的方式行驶,充分利用交通和气象数据。 电气化 – 电池和发动机技术的持续发展将使电动车更加便捷、经济且环保。 共享化 – 共乘服务会改变用车模式,从拥车模式改变为“即服务”模式(听起来是否有几分熟悉?)。 无论单独来看还是整体来看,这些新兴的属性都意味着,未来十年我们将看到和使用的汽车和卡车将与过去截然不同。 AWS 伴您出行 AWS 客户已经在利用我们的 AWS IoT、边缘计算、Amazon Machine Learning 和 Alexa 产品来让这样的未来照进现实 – 汽车制造商、其一级供应商和汽车科技初创公司都在将 AWS 用于自己的 ACES 计划。AWS Greengrass 在这方面发挥了重要作用,富有吸引力的设计俘获了客户,并帮助他们在边缘处增加处理能力和机器学习推测。 AWS 客户 Aptiv(前身为 Delphi)在 AWS re:Invent 会议上探讨了他们的 Automated Mobility on Demand (AMoD) 智能汽车架构。Aptiv 的 […]

Read More

如何利用 AWS Lambda 和 Tensorflow 部署深度学习模型

深度学习已经彻底变革了我们处理和加工真实数据的方式。深度学习的应用程序有多种类型,包括用于整理用户照片存档、推荐书籍、检测欺诈行为以及感知自动驾驶车辆周边环境的应用程序。 在这篇文章中,我们将向您逐步演示如何通过 AWS Lambda 使用自定义的训练模型,从而大规模利用简化的无服务器计算方法。在此过程中,我们将介绍一些核心 AWS 服务,您可以使用这些服务以无服务器的方式运行推理。 我们还将了解图像分类:现在已有多种表现非常出色的开源模型可供使用。通过图像分类,我们可以使用深度学习中两种最常用的网络类型:卷积神经网络和全连接神经网络 (也称为 Vanilla 神经网络)。 我们将向您演示在 AWS 中的什么位置放置训练模型,以及以何种方式打包您的代码,以便 AWS Lambda 通过推理命令执行这些代码。 在这篇博客文章中,我们将讨论以下 AWS 服务:AWS Lambda、Amazon Simple Storage Service (S3)、AWS CloudFormation、Amazon CloudWatch 和 AWS Identity and Access Management (IAM)。使用的语言和深度学习框架包括 Python 和 TensorFlow。此处介绍的流程也适用于任何其他深度学习框架,例如 MXNet、Caffe、PyTorch、CNTK 及其他框架。 整体架构 AWS 架构 从流程的角度而言,深度学习系统的开发和部署与开发和部署传统解决方案应该没有不同。 下图描述了一种可能的开发生命周期: 如您从图中可见,通常的软件开发流程经过多个阶段,从开发环境中的概念成形和建模,直到生产环境中的最终模型部署。在大部分情况下,开发阶段会有多次快速迭代,需要不断对环境进行更改。通常,这会影响在软件/模型开发期间所用资源的性质和质量。对于敏捷开发而言,能够快速构建/重建/停用环境至关重要。所构建软件的快速改变随之而来的应该是基础设施调整。敏捷开发和加速创新的先决条件之一是能够通过代码管理基础设施 (称为 IaC:基础设施即代码)。 软件设计管理、构建和部署的自动化是持续集成和持续交付 (CI/CD) 的一部分。虽然本文不会深入介绍精心编排的 CI/CD 管道的细节,不过,对于任何开发运营团队来说,如果希望构建可重复的流程,以实现开发/部署敏捷性和流程自动化,就应该记住这一点。 AWS 在社区中推出了众多服务和实践,可简化开发任务。一个环境,只要使用自动化代码构建,那么只需数分钟就可以轻松地采用和复制,例如,可以根据开发环境所用的模板构建暂存和生产系统。 此外,AWS […]

Read More

成本优化利器——Amazon EC2 Spot实例详细介绍

1.  前言 AWS EC2实例类型从实例类型上可以划分成通用型,计算优化型,内存优化型,存储优化型,GPU加速计算等实例类型。从实例的购买模式来看,又可以分为按需实例、预留实例、专用实例、Spot实例等类型。今天我来给大家介绍一下Spot实例这样一个非常有特色的实例类型。本文将会着重介绍Spot实例的基本概念,新的定价模型和计费方法,如何启动Spot实例,以及Spot实例的中断处理,Stop和Resume,Hibernate。希望通过这篇文章,您可以对Spot实例有个全面的了解。 2.  什么是Spot实例(Spot Instance) Amazon EC2 Spot 实例,是 AWS服务中的可用空闲计算容量。与按需实例的价格相比,这类实例可提供超低折扣。EC2 Spot 可帮助您优化 AWS服务的成本,可在预算相同的情况下将应用程序的吞吐量提高到10倍。您只需在启动 EC2 实例时选择“Spot”,即可节省按需实例价格的 90%; 按需实例和 Spot 实例的唯一区别在于,当 EC2 需要更多容量时,它会发出两分钟的通知继而中断 Spot 实例。您可以将 EC2 Spot 用于各种容错且灵活的应用程序,如测试和开发环境、无状态 Web 服务器、图像渲染、视频转码,以运行分析、机器学习和高性能计算 (HPC) 工作负载。EC2 Spot 还可与其他 AWS 产品紧密集成,包括 EMR、Auto Scaling、Elastic Container Service (ECS)、CloudFormation等,让您可以灵活选择如何启动和维护 Spot 实例上运行的应用程序。 Spot实例是购买和使用 Amazon EC2 实例的新方式。Spot实例的现货价格根据供需情况定期变化。直接使用类似购买按需实例的方式启动Spot实例,价格将根据供需关系确定(不超过按需实例价格);用户也可以设置一个最高价,当设置的最高价高于当前现货价格的期间内运行此类实例。Spot实例是按需实例和预留实例的补充,为获得计算容量提供了另一种选择。以下是Spot实例的一些基本概念: Spot实例池 – 一组未使用的 EC2 实例,具有相同的实例类型、操作系统、可用区。 现货价格 – Spot […]

Read More

T2 Unlimited – 以高性能突破突发限制

我第一次撰写关于 T2 实例的文章是在 2014 年夏季,在该文章中我讨论了有多少工作负载对持续计算能力有适度的需求但偶尔需要更多的计算能力。该模型引起了我们客户的共鸣;T2 实例非常受欢迎,现在用于托管微服务、低延迟交互式应用程序、虚拟桌面、构建和暂存环境、原型等等。 新的 T2 Unlimited 实例 今天我们正在扩展突发模式,该模式首先在 T2 上得以应用,使您能够在任何期望的时间内维持高 CPU 性能,同时仍然保持尽可能低的成本。您只需在启动实例时启用此功能即可;您也可以为已经运行的实例启用此功能。如果平均 CPU 利用率在 24 小时时段内低于基线,则每小时 T2 实例价格将涵盖使用中的所有临时峰值。如果实例在较长时间内以较高的 CPU 利用率运行,则会产生一小笔小时费用。例如,如果您运行的 t2.micro 实例在 24 小时内的平均使用率为 15% (比基线高出 5%),则将额外收取 6 美分 (每个 vCPU 小时 5 美分 * 1 个 vCPU * 5% * 24 小时)。 要从 EC2 控制台启动 T2 无限实例,请选择任意 T2 实例,然后单击 T2 Unlimited […]

Read More

现已推出 – Amazon EC2 的计算密集型 C5 实例

我很高兴地宣布,新的计算密集型 C5 实例今天在三个 AWS 区域推出,有六种大小规格! 这些实例专用于计算密集型应用程序,例如批处理、分布式分析、高性能计算 (HPC)、广告服务、高度可扩展的多人游戏和视频编码。新实例提供了比 C4 实例高 25% 的价格/性能改进,对于某些工作负载可超过 50%。它们还有额外的每 vCPU 内存,而且 (对于可以利用新 AVX-512 指令的代码) 对于向量和浮点工作负载有两倍的性能。 多年来,我们一直在不停地工作,为客户提供可能的最佳网络、存储和计算性能,长期专注于将许多类型的工作分流到由 AWS 设计和建造的专用硬件上。C5 实例类型包含了我们的最新一代硬件分流,另外还在添加一个与我们的硬件密不可分地一起运行的新管理程序方面又迈出了一大步。新的管理程序允许我们让您访问主机硬件提供的所有处理能力,同时也使性能更加一致,并进一步提高了安全性的门槛。我们将在 AWS re:Invent 分享很多关于它的技术细节。 新实例 C5 实例有六种大小: 实例名称 vCPU RAM EBS 带宽 网络带宽 c5.large 2 4 GiB 最高 2.25 Gbps 最高 10 Gbps c5.xlarge 4 8 GiB 最高 2.25 Gbps 最高 10 Gbps c5.2xlarge […]

Read More

如何使用Amazon EC2 Systems Manager自动创建数据一致的EBS快照(Part 2)

作者:王宇 上一期我们讨论了如何在不关机的前提下实现AWS上实例的数据一致性快照问题,传送门:《如何使用Amazon EC2 Systems Manager自动创建数据一致的EBS快照(Part 1)》 在本文的介绍中,我们将共同探索如何利用Amazon EC2 Systems Manager(SSM)和Microsoft VSS (Volume Shadow Copy Service)来创建数据一致的EBS快照。 SSM + VSS数据一致快照的原理 VSS (Volume Shadow Copy Service)是一个Windows操作系统内置的服务,用来协调与VSS兼容的应用程序(如SQL Server、Exchange Server等)的备份工作,如冻结或释放这些应用程序的I/O操作等。 VSS服务能够启动和监督副本拷贝的创建。“副本拷贝”是指一个逻辑卷在某一个时间点上的数据一致快照。比如:“C:”是一个逻辑卷,它与EBS快照不同。创建副本拷贝的步骤包括: 请求方向VSS发出创建副本拷贝的请求。 VSS provider创建并维护副本拷贝。 VSS写入器(writer)保证数据的一致性。写入器负责在VSS provider创建副本拷贝之前固化临时数据并冻结I/O操作,并在VSS provider完成创建后释放I/O操作。通常情况下,会为每一个与VSS兼容的应用程序分配一个独立的写入器(writer)。 我们可以使用Run Command在windows实例中运行一个PowerShell脚本: $EbsSnapshotPsFileName = “C:/tmp/ebsSnapshot.ps1” $EbsSnapshotPs = New-Item -Type File $EbsSnapshotPsFileName -Force Add-Content $EbsSnapshotPs ‘$InstanceID = Invoke-RestMethod -Uri http://169.254.169.254/latest/meta-data/instance-id’ Add-Content $EbsSnapshotPs ‘$AZ = […]

Read More

产品更新 – Amazon EC2 P3 实例多达 8 个 NVIDIA Tesla V100 GPUs 提供支持

自从我们于 2006 年发布最初的 m1.small 实例以来,在客户需求的推动以及不断发展的先进技术的支持下,我们后续推出了各种强调计算能力、超频性能、内存大小、本地存储和加速计算的实例。 新的 P3 现在,我们正在打造下一代 GPU 加速的 EC2 实例,这些实例将会在 4 个 AWS 区域提供。P3 实例由多达 8 个 NVIDIA Tesla V100 GPU 提供支持,可用于处理计算密集型的机器学习、深度学习、计算流体动力学、计算金融学、地震分析、分子模拟和基因组学工作负载。 P3 实例使用运行速度可高达 2.7 GHz 的 Intel Xeon E5-2686v4 定制处理器。有三种大小的实例可供选择 (所有均仅限 VPC 和 EBS): 模型 NVIDIA Tesla V100 GPU GPU 内存 NVIDIA NVLink vCPU 主内存 网络带宽 EBS 带宽 p3.2xlarge 1 16 GiB […]

Read More