亚马逊AWS官方博客
OpenSource | “转盘”
确保 AWS 云在全球范围内高效运转绝非易事。团队迅速发展,新领导必须时刻谨记我们为服务运营设立的高标准,而高层领导必须能够定期检查堆栈深层的情况。
十多年来,我们采用的其中一种机制是:高层领导、所有服务总经理和众多工程师每周召开一次两小时的会议,审核服务指标、提出和解决问题并分享最佳实践。而现在,AWS 有一百多项服务,再召开这样的会议就非常困难了!
早期,我们会每周检查各个服务团队 (例如 Amazon S3 和 Amazon EC2) 的指标。但是,随着服务逐渐增多,通过一次会议审核所有服务已经不可能了。缩减报告名单可以确保每个团队都能定期汇报,但我们希望,无论是否被选中在大型会议上进行汇报,每个团队都能做好每周报告的准备,并确保团队领导了解详细信息。Wheel 便应运而生了。
它起源于手工制作的“幸运转盘”- 转一下试试手气,就像县集市上的幸运抽奖活动。
我们的周会通常是每十五分钟一个议题。在某些时段,我们会深入讨论特定事件,但多数时间,我们会随机抽选报告团队!被选中的团队将逐一介绍他们运营控制面板上的内容,说明运营绩效,并回答会议室内有经验的运营领导提出的问题。
实物转盘只能为我们提供这么多帮助:它很难随着新服务的增加不断更新,我们根本无法增加更多栏位。我们是工程师,我们用技术解决问题。
在一次题为 AWS 如何运作每周运营会议的 re:Invent 大会演讲中,David Lubell 和 Kevin Miller 首次展示了 Wheel 的软件版本,并宣布版本 1.4 已实现开源。此开源版本由我们团队的 Amit、Dan、Dave、Jeff、Lukasz、Xiujin 和 Matt 为您呈现,他们构建了自动化程序,可以帮助 AWS 服务实现良好的规模运营。
Wheel 通过 AWS Lambda、Amazon API Gateway、Amazon Cognito 和 AWS Cloud Formation 实施,并提供 JavaScript 用户界面。新版本对旧版转盘的某些方面进行了优化,例如,引入了加权随机化的概念,以便降低重新选择近期所选项的概率。
您还可以为选择过程添加幽默元素:
我们还未来得及进行的一项改进是可自定义的外观 – 我们讨论过几种外观方案:老虎机、算命机器人甚或是 3D 版本。
对于客户来说,Wheel 可让他们深入了解 AWS 如何大规模运营服务,并证明了有效的解决方案不一定要复杂。但是,即使您不负责管理每周运营会议,也可能会发现 Wheel 的便利之处:或许可以用来选择本周团队会议的记录人,或决定在家里谁洗碗。
想尝试一下并运行您自己的 Wheel 版本?从 GitHub 上获取。我们希望社区积极建言献策,并聆听您使用这款工具的故事。
感谢 Julian Wood 就 Dave Lubell 和 Kevin Miller 的 re:Invent 大会演讲所写的博文。