亚马逊AWS官方博客

OpenSource | “转盘”

确保 AWS 云在全球范围内高效运转绝非易事。团队迅速发展,新领导必须时刻谨记我们为服务运营设立的高标准,而高层领导必须能够定期检查堆栈深层的情况。

十多年来,我们采用的其中一种机制是:高层领导、所有服务总经理和众多工程师每周召开一次两小时的会议,审核服务指标、提出和解决问题并分享最佳实践。而现在,AWS 有一百多项服务,再召开这样的会议就非常困难了!

早期,我们会每周检查各个服务团队 (例如 Amazon S3Amazon EC2) 的指标。但是,随着服务逐渐增多,通过一次会议审核所有服务已经不可能了。缩减报告名单可以确保每个团队都能定期汇报,但我们希望,无论是否被选中在大型会议上进行汇报,每个团队都能做好每周报告的准备,并确保团队领导了解详细信息。Wheel 便应运而生了。

它起源于手工制作的“幸运转盘”- 转一下试试手气,就像县集市上的幸运抽奖活动。

我们的周会通常是每十五分钟一个议题。在某些时段,我们会深入讨论特定事件,但多数时间,我们会随机抽选报告团队!被选中的团队将逐一介绍他们运营控制面板上的内容,说明运营绩效,并回答会议室内有经验的运营领导提出的问题。

实物转盘只能为我们提供这么多帮助:它很难随着新服务的增加不断更新,我们根本无法增加更多栏位。我们是工程师,我们用技术解决问题。

在一次题为 AWS 如何运作每周运营会议的 re:Invent 大会演讲中,David Lubell 和 Kevin Miller 首次展示了 Wheel 的软件版本,并宣布版本 1.4 已实现开源。此开源版本由我们团队的 Amit、Dan、Dave、Jeff、Lukasz、Xiujin 和 Matt 为您呈现,他们构建了自动化程序,可以帮助 AWS 服务实现良好的规模运营。

Wheel 通过 AWS LambdaAmazon API GatewayAmazon CognitoAWS Cloud Formation 实施,并提供 JavaScript 用户界面。新版本对旧版转盘的某些方面进行了优化,例如,引入了加权随机化的概念,以便降低重新选择近期所选项的概率。

您还可以为选择过程添加幽默元素:

我们还未来得及进行的一项改进是可自定义的外观 – 我们讨论过几种外观方案:老虎机、算命机器人甚或是 3D 版本。

对于客户来说,Wheel 可让他们深入了解 AWS 如何大规模运营服务,并证明了有效的解决方案不一定要复杂。但是,即使您不负责管理每周运营会议,也可能会发现 Wheel 的便利之处:或许可以用来选择本周团队会议的记录人,或决定在家里谁洗碗。

想尝试一下并运行您自己的 Wheel 版本?从 GitHub 上获取。我们希望社区积极建言献策,并聆听您使用这款工具的故事。


感谢 Julian WoodDave Lubell 和 Kevin Miller 的 re:Invent 大会演讲所写的博文

Deirdré Straughan

Deirdré Straughan

Deirdré 致力于推广技术和帮助他人开展这方面的工作已有 30 年的时间。截至目前,她撰写了一本书并参与了两本以上书籍的编辑;她还开展和进行技术培训、制作了数百个视频并进行技术讲座直播;此外,她还负责多个技术博客的编写、编辑和管理以及负责活动的管理。自 2010 年起,她便利用自己的一技之长投身云计算,投身开源的时间还要长一些。她于 2017 年 6 月加入 AWS,担任 AWS 开源团队的内容负责人。她的 Twitter 账号是 @deirdres。