亚马逊AWS官方博客

使用Amazon SageMaker原生TorchServe集成在生产中支持PyTorch模型

随着客户对于TorchServe需求的不断增长以及PyTorch社区的快速发展,AWS致力于为客户提供一种通用且高效的PyTorch模型托管方式。无论您使用的是Amazon SageMaker、 Amazon Elastic Compute Cloud (Amazon EC2)还是 Amazon Elastic Kubernetes Service (Amazon EKS), 我们都将不断优化后端基础设施并为开源社区提供支持。

Read More

利用Amazon ReplaceRootVolume替换实例EBS根卷

客户在使用EC2过程中,难免会碰到诸如根卷损坏或操作系统配置错误,导致无法连接和登录的情况。这会增加日常迁移、重建等繁杂的工作。尤其是客户在采用了存储优化实例(如i3、i3en、d2等)下,自建的服务下(如Hadoop、Kafka),数据丢失、拷贝等成本会非常高。 这些在实例存储上昂贵的数据复制操作、繁杂的迁移重建等工作,往往是客户无法承受的。现在依托Amazon ReplaceRootVolume新特性,将帮助客户解决上述问题,轻松应对出现的各种挑战。

Read More

Amazon Go 无人零售商店揭秘

几天前 CNBC 的一则新闻引起了我的兴趣。文章说的是美国康涅狄格州布鲁克菲尔德一家在建商店的有了应用“Just Walk Out”技术的迹象,包括门控系统和可能用于安装天花板摄像头的硬件等等。这一下子让我联想到了2017年出现的那个让人兴奋不已的“Amazon Go”无人值守的零售商店以及在其背后的科技。 在电子商务以及零售领域,亚马逊公司堪称业内翘楚。竞争者经常带着崇敬和恐惧的口吻谈论这个名字。亚马逊以不断创新的步伐取得了几乎神话般的地位,让尾随者难以跟上他的步伐。在过去的26年中遵循着“亚马逊增长飞轮”,不断提高易用性、增加选择,实现快速交付和完善整体用户体验。而Amazon Go 无疑是这许多亮眼的成就中最显著的一个。 2017年,因为员工的便利条件我第一次体验了位于西雅图亚马逊办公楼 DayOne一层的Amazon Go 商店。这个第一家Amazon Go商店的面积约为550平方米,看起来就像是一家街角的便利店。里面有很多新鲜的水果,面包,沙拉,饮料等商品,供上班族们取个早餐,拿个零食。没有用“买”这个词是因为在这里你看不到任何我们习以为常的“买”的动作。 人类购买这个行为已经延续了几千年,一成不变的是物品以等值进行交换的商业规则。而变化的则是商品、购物环境、交互体验以及结算方式。随着云计算的兴起以及各种新技术应用不断地优化购物体验、简化购买流程,让我们得以更从容,更优雅的享受购物的乐趣。Amazon Go就是以这个“不用排队,拿了就走( no lines,no check out)的全新购物体验在零售行业和科技圈吸引了无数目光。今天我们就来一起看看这个拿了就走的新的零售体验是如何实现的。   使用体验 用户体验:手机 App Amazon Go 的使用者首先需要下载并安装一个尺寸大约为11MB的一个名为Amazon Go的手机App。安装后,将使用Amazon帐户ID和密码进行登录。首次登录时,这个应用程序将引导完成9步动画教程的学习。该教程介绍了如何将自己扫描到商店以及如何购物。整个教程花费了大约一分钟的时间。接下来,应用程序将显示一个二维条形码以识别使用者的身份,凭借扫描这个二维码进入商店。 出于安全的考虑,这个二维码每30秒在手机App重新生成一次,这可以提供一定程度的保护,防止人们仅通过拍照我的二维码码就可以在我的帐户上购物。   用户体验:进入商店 进入亚马逊商店有点类似于进入地铁站,对我们来说这个体验并不陌生。不过在商店入口经常有一两个身穿橙色衬衫的亚马逊员工帮助人们解决任何问题,最常见的就是向顾客解释他们需要下载应用程序,并向他们解释它是如何工作的。随着越来越多的人习惯于这个进店的方式,人们将会减少对入口处工作人员的需求。   用户体验:购物与付款 购物者可以通过拿走开放式货架上的商品并走出商店来购买和付款。购物的体验就是这样的简单。因此,Amazon Go的出现并非是炫技,而是出于解决真实存在的购物中排队、等候结账这个真实的问题。   Amazon Go的技术复杂性 在一段广为流传的Amazon Go 宣传视频中,顾客进店扫码-取物-出门,一气呵成。简单到很多人第一次去都会有一种隐隐的“我是不是在偷东西”的质疑。但细细想来,被这个名为“Just walk out” 技术简化的只是商品价格的手动或自动的复核过程。而实现它看起来我们只需知道哪些亚马逊账户在商店内购物,哪些商品被拿走。这样我们就可以在顾客完成购物时向其收取费用了。够简单,但又是什么使这个过程变复杂的? 设想一下,如果我们来解决这个问题,或许你会从这个场景出发:一个人在商店,悠闲地闲逛,随意拿起一件商品. 看起来我们只需处理这样的场景即可。然而,现实情况更像这样:拥挤的人群,人们在购物,孩子们四处奔跑,婴儿车上的婴儿还在熟睡。现实且自然的购物行为就是人们并不总是拿上商品然后离开 — 他们往往挑选一个商品,看看它,然后把它放回货架上;或者有时他们把它放回另一个错误的货架之上。相信你已经在脑海里想象出来这件事的复杂性了。在亚马逊解决这个问题的方案被称作“Just Walk Out”。 这个方案体现了最新的工程技术的进步,特别是在复杂的计算机视觉、传感器融合和深度学习方面。       […]

Read More

新增功能 – 适用于 Amazon Elastic File System 的更低成本存储类别

Amazon Elastic File System (Amazon EFS) 为跨 Amazon Elastic Compute Cloud (EC2) 实例或使用容器和无服务器服务共享的数据提供了简单、无服务器、设置即忘的弹性文件系统,例如 Amazon Elastic Container Service (ECS)、Amazon Elastic Kubernetes Service (EKS)、AWS Fargate,以及 AWS Lambda。截至目前,客户可以选择 Amazon EFS 标准存储类别,在多个地理位置相互分离的可用区 (AZ) 中以冗余方式存储数据,从而提供最高级别的可用性和持久性。 今天,我很高兴地向大家介绍 Amazon EFS 单区存储类别,与 Amazon EFS 标准存储类别相比,其可节约 47% 的存储成本。例如,在美国东部(弗吉尼亚北部)区域,如果您使用生命周期管理且 80% 的数据不经常被访问,则能够实现每月 0.043 USD/GB 的有效存储价格。Amazon EFS专为 99.999999999% 的耐用性而设计,而 EFS 单区存储类别则可提供 99.9% 的可用性 SLA,同时在弹性、易用性、可扩展性和生命周期管理等方面保持了与标准存储类别相同的性能。 我们将推出两个新的单可用区存储类别,Amazon EFS 单区 […]

Read More

AWS Fault Injection Simulator – 通过对照实验提高弹性

AWS 为您提供构建高度可靠的系统所需的组件:多区域(每个都有多个可用区)、Amazon CloudWatch(指标、监控和警报)、Auto Scaling、负载均衡、多种形式的跨区域复制等等。如果您根据架构完善的框架中提供的指南将这些组件构建在一起,即使单个组件出现故障,您的系统应该也能继续运行。 但是,只有执行了正确的测试后,您才会知道情况确实如此。混沌工程(以“灾难大师”Jesse Robbins 在Amazon.com 早期所做的开创性工作为基础,随后由 Netflix Chaos Monkey 发扬光大)这一相对较新的领域着重于通过创建破坏性事件、观察系统的响应方式以及实施改进来向应用程序施加压力。除了指出需要改进的领域之外,混沌工程还可帮助发现需要进一步监控和发出警报的盲点、发现曾经隐藏的实施问题,并为您提供提高运营技能的机会,同时缩短恢复时间。要了解有关此主题的更多信息,请首先从我的同事 Adrian Hornsby 撰写的混沌工程 – 第 1 部分开始。 隆重推出 AWS Fault Injection Simulator (FIS) 今天,我们隆重推出AWS Fault Injection Simulator (FIS)。这项新服务将通过注入故障并让您了解发生的情况,来帮助您对 AWS 工作负载执行对照实验。您将了解系统如何应对各种类型的故障,而且您还将更好地了解故障模式。您可以首先在预生产环境中运行实验,然后逐步将其作为 CI/CD 工作流的一部分运行,最终在生产环境中运行。 每个 AWS Fault Injection Simulator (FIS) 实验针对一组特定的 AWS 资源并对其执行一系列操作。我们将推出对 Amazon Elastic Compute Cloud (EC2)、Amazon Elastic Container Service (ECS)、Amazon Elastic Kubernetes Service […]

Read More

新的 Amazon EC2 X2gd 实例 – 利用 Graviton2 的强大性能助力处理内存密集型工作负载

我们在 2018 年末推出首批 Graviton 支持的 EC2 实例,并且仅在一年后便宣布推出后续 Graviton2 处理器。双 SIMD 单元、对 int8 和 fp16 指令的支持以及代际之间的其他架构改进,这一切让 Graviton2 成为极具成本效益的主力处理器。 现在,您可以从通用型(M6g 和 M6gd)、计算优化型(C6g、C6gn 和 C6gd)、内存优化型(R6g 和 R6gd)和突发型 (T4g) 实例中进行选择,这些实例都由快速、高效的 Graviton2 处理器提供支持。我们的客户使用这些实例来运行应用程序服务器、游戏服务器、HPC 工作负载、视频编码、广告服务器等。多个基准测试(包括这个和这个)表明,这些基于 Graviton2 的实例比现有 EC2 实例具有更好的性价比。 新的 X2gd 实例 我很高兴宣布不断增加的 Graviton2 支持实例的最新动态! 在每个 vCPU 的内存方面,新 X2gd 实例是内存优化型 R6g 实例的两倍,专为内存耗尽的工作负载而设计。其中包括内存中数据库(Redis 和 Memcached)、开源关系数据库、电子设计自动化的设计与验证、实时分析、缓存服务和容器。 X2gd 实例提供八种尺寸,也有裸机形式。规格如下: 名称 vCPU 数量 内存 (GiB) […]

Read More

IAM Access Analyzer 更新 – 策略验证

AWS Identity and Access Management (IAM) 是 AWS 的一个重要的基本组成部分。您可以创建 IAM 策略和服务控制策略 (SCP),定义对特定 AWS 服务和资源的所需访问权限级别,然后将策略附加到 IAM 委托人(用户和角色)、用户组或 AWS 资源。随着 IAM 助您实现精细控制,您有责任正确使用它,几乎一直寻求建立最低权限访问。IAM 教程将帮助您了解更多信息,IAM Access Analyzer 将帮助您识别与外部实体共享的资源。我们最近推出了 IAM Access Analyzer 的更新,允许您在部署权限更改之前验证对 S3 存储桶的访问。 新策略验证 今天,我很高兴地宣布,我们正在向 IAM Access Analyzer 添加策略验证。这项强大的新功能将帮助您构建 IAM 策略和 SCP,这些都采用经过时间考验的 AWS 最佳实践。 验证专为开发人员和安全团队而设计,在策略附加到 IAM 委托人之前执行。我们执行了 100 多项检查,每项检查旨在改善您的安全状况并帮助您大规模简化策略管理。每次检查的结果都包括详细信息和具体建议。 您可以从 IAM 控制台中的 JSON 策略编辑器访问验证,也可以通过命令行 (aws accessanalyzer validate-policy) 和您自己的代码 […]

Read More

Amazon S3 迎来 15 岁生辰 – 5475 天,100 万亿个对象 – Amazon S3 初心不变

在 15 年前的今天,我在博文中宣布推出 Amazon Simple Storage Service (S3)。在该文中,我明确指出这种服务要通过 API 访问,它面向开发人员,此外还简要介绍了一些关键功能,并分享了定价信息。许多开发者发现了那篇文章,然后就开始使用 S3 API 编写代码来存储和检索对象,剩下的就是我们都知道的历史了! 今天我要很高兴地宣布,S3 存储的对象数量已经超过 100 万亿(1014,也就是 100000000000),而且经常达到峰值,每秒要处理数千万个请求。这几乎相当于全球每一个人在这里存储了 13000 个对象,或者在浩瀚宇宙的大约两万亿个星系中,每个星系都在我们这里存储了 50 个对象(根据这份 2021 年的估计数据)。 简单的开端 回顾那次发布,我们当时做了很多决定,事实已经证明,那些决定是正确的,可以帮助开发者在几分钟内轻松理解并开始使用 S3: 我们从一个简单的概念模型开始:唯一命名的存储桶,可以容纳任意多个对象,每个对象都由一个字符串键标识。最初的 API 也同样简单:创建存储桶、列出所有存储桶、放入对象、获取对象以及放入访问控制列表。这种简单的机制帮助我们避开了“单向门”,给我们留下了根据客户反馈改进 S3 的充足空间。所有这些决定至今仍然有效,在发布会当天编写的代码时至今日仍然可以正常运行。 在讨论了许多不同的定价模式之后(在《Working Backwards》这本书中有详细说明),我们选择了一种跟随成本的定价模式。因为当时 Colin 和 Bill 说: 如果实施跟随成本的定价模式,那么如果无论开发人员通过何种方式使用 S3,他们都会以符合自身要求的方式加以使用,并且会努力最大限度地降低成本,这也会降低我们的成本。这样就不会有系统层面的博弈,我们也不必去费心估计难以捉摸的“普通客户”会如何使用 S3 来设定要支付给我们价格。 根据跟随成本的模式,我们多次降低 S3 的每 GB 每月价格,并且还引入了存储类别,这让您可以进一步减少为存储不那么常用的数据(S3 Glacier 和 S3 Glacier Deep Archive)以及可以在必要情况下重建的数据(S3 单区 – […]

Read More