优势
概述
加密货币衍生品交易服务 Flipster 自 2021 年成立以来便基于 Amazon Web Services(AWS)运营,利用 AWS 云基础设施的高安全性与高可靠性。Flipster 团队希望在优化其 Amazon Elastic Compute Cloud(Amazon EC2)工作负载成本的同时,进一步提升性能。Amazon EC2 能为几乎所有工作负载提供安全且可调整大小的计算容量。经过评估,Flipster 决定迁移至 AWS Graviton 处理器。该处理器是 AWS 专门设计的服务器处理器,可为在 Amazon EC2 上运行的云工作负载提供出色的性价比。此次迁移帮助 Flipster 实现了成本优化,提升了峰值负载稳定性,并降低了部分服务的延迟。
关于 Flipster
Flipster 是一家加密货币交易平台,提供超过 250 种加密货币的挂牌服务,支持买卖与交易操作。该平台在 177 个国家拥有 100 万注册用户,日交易量约为 10 亿美元。
机会 | 借助 AWS Graviton 为 Flipster 优化成本
Flipster 拥有 100 万注册用户,日交易量约 10 亿美元。这项加密货币交易服务提供具有竞争力的交易手续费、快速挂牌等独特功能。为持续向用户提供高性价比服务,Flipster 需要优化其 Amazon EC2 工作负载的成本。
此外,Flipster 团队还需解决现有处理器存在的超线程问题。Flipster 的 CPU 利用率高达 80%,其 x86 处理器的超线程功能意味着每个处理器中的物理内核会像包含多个虚拟内核一样运行。
Flipster 首席技术官 Jaewon An 说:“在与新加坡技术领袖交流时,他们都对 Graviton 的性价比赞不绝口。”该团队决定开展一项低风险试点项目来评估 Graviton。由于 Flipster 在 Amazon Elastic Kubernetes Service(Amazon EKS,一项完全托管的 Kubernetes 服务)上采用基于微服务的架构,因此通过在其 Amazon EKS 集群中添加几个基于 Graviton 的 Amazon EC2 节点进行了测试。鼓舞人心的结果促使 Flipster 迁移至 Graviton。
解决方案 | 将成本降低高达 20%,部分服务的延迟降低高达 40%
Flipster 团队将迁移计划分为三个阶段:准备、测试和部署。团队成员参加了多场关于 Graviton 的 AWS 会议,并参考了大量文档,为迁移做准备。由于 Graviton 处理器采用 Arm 指令集,团队在其编程语言库中创建了 Arm 版本,以确保能与 Graviton 兼容。Flipster 还升级了持续集成和持续交付管道,实现了 Arm 和 x86 映像的一次性发布,并开展了内部性能基准测试,以对 Graviton 与 x86 进行比较。测试结果显示,Graviton 的多线程性能与 x86 相当,因此团队确信能够在不影响性能的前提下实现成本优化。
在为期 3 周的测试阶段,团队将 Graviton 节点加入测试集群,并逐一迁移微服务。质量保证团队开展了功能与延迟测试,同时监控每个微服务的性能表现。测试结果显示,所有功能均能正常运行。在高负载压力测试中,Graviton 的延迟与吞吐量明显比 x86 处理器更稳定。因此,团队有信心继续推进迁移。
在部署期间,团队仅用 1 周便完成了生产环境的迁移。他们分批次让 Graviton 上线,同时密切监控各项指标以排查潜在问题。通过采用 x86 与 Arm 映像的双池,Flipster 将风险降至最低,因为如果出现任何问题,可随时回滚至 x86 处理器。实际上,迁移过程十分顺利,停机时间几乎为零,因此无需回滚。团队也无需对任何应用程序重新编码,仅需调整 15 个 Docker 文件的路径,以及持续集成和持续交付的配置,生产环境便可在 Graviton 上正常运行。
目前,Flipster 已完成 95% 的生产环境迁移。其关键工作负载、对延迟敏感的工作负载以及输入/输出密集型工作负载(包括风险引擎与分析管道)均能在 Graviton 上平稳运行。An 表示:“我们的 Amazon EC2 账单减少了 10%;如果剔除迁移期间新增功能与流量增长的影响,实际成本节省高达 20%。”
Flipster 还成功解决了超线程问题,这得益于 Graviton 的物理内核能够简化容量使用量的计算。Flipster 的 CPU 利用率降幅高达 15%,这意味着峰值负载下的饱和度更低,稳定性更高。此次迁移还帮助部分服务将延迟降低了 40%,同时提升了性能表现。An 表示:“整个过程非常顺利。迁移到 AWS Graviton 是一次很愉快的体验,我们在 1 个月内就实现了成本与延迟的降低,性能指标也更加稳定。”
还有一个原因让 Flipster 的工程师对此次迁移感到满意。由于他们的开发电脑同样采用 Arm 指令集,因此新功能的构建时间得以缩短。在迁移之前,工程师必须借助 x86 虚拟机来构建功能映像并进行测试。而现在,统一的架构让这一步骤成为了历史。
成果 | 加速功能部署并探索生成式人工智能以增强用户体验
Flipster 的用户已从功能的快速部署和推出中受益。即便在峰值负载期间,基于 Graviton 的解决方案也能为用户提供更稳定的服务。此外,Flipster 将成本节省的优势传递给了客户,不仅维持零交易手续费,还保持窄幅点差。
Flipster 很快就会将剩余 5% 的计算实例迁移至 Graviton。该服务计划通过在其他 AWS 区域搭建集群来提升性能,并借助 AWS Lambda 进一步降低延迟,后者让企业无需考虑服务器或集群,即可直接运行代码。
同时,Flipster 还打算探索如何利用生成式人工智能(AI)优化其服务。团队正与 AWS 合作,研究如何运用 Amazon Bedrock(借助基础模型构建和扩展生成式人工智能应用程序的最简单方法)。“AWS 为我们提供了极大的帮助”,An 说,“我们不仅能快速获得支持,与 AWS 团队的合作体验也非常好。”
迁移到 AWS Graviton 是一次很愉快的体验,我们在 1 个月内就实现了成本与延迟的降低,性能指标也更加稳定。
Jaewon An
Flipster 首席技术官使用的 AWS 服务
开始使用
找到今天要查找的内容了吗?
请提供您的意见,以便我们改进网页内容的质量。