亚马逊AWS官方博客

动如脱兔 静若磐石 新一代云原生无服务数据库Aurora Serverless V2重装上阵

一、前言

Aurora Serverless 是 Amazon Aurora 的按需自动扩展配置。Aurora Serverless v2 在几分之一秒内将数据库工作负载扩展到数十万个事务。它以细粒度的增量调整容量,为应用程序的需求提供适量的数据库资源。您无需管理数据库容量,只需为应用程序消耗的资源付费。早在2018年Amazon Aurora 即提供了 Serverless 选项。

Amazon Aurora最新提供的Aurora Serverless V2版本相比于上一代V1版本更上一层楼,重点提升部分:资源容量采用原地扩展,使资源容量扩展速度由V1分钟级提升到秒级,v2 版本能够在容量调整时做到更细粒度, 以0.5 ACU作为扩展单元(V1翻倍扩展),并能够依据多个维度进行容量调整,通过持续的监控和尽可能大的利用缓冲池。Aurora Serverless v2 相比V1增加了完整的 Amazon Aurora 功能,包括多可用区支持、只读副本和全球数据库等,支持跨 AZ和跨区域的高可用部署和读取扩展。

Amazon Aurora Serverless v2 非常适合各种应用程序。例如,面对业务快速增长场景与海量多租户场景时,当拥有数十万个应用程序的企业,或拥有具有成百上千个数据库的多租户环境的软件即服务 (SaaS) 供应商,可以使用 Amazon Aurora Serverless v2 来管理整个SaaS应用中众多数据库的容量,同时还适用于业务吞吐量波动明显的场景,如游戏业务、电商业务、测试环境等,以及无法预估吞吐量的新业务系统。对于大部分时间都处于低谷的业务系统,Amazon Aurora Serverless v2 可以有效地为客户节省成本。

作为新一代云原生无服务数据库, Aurora Serverless V2提供了无与伦比弹性伸缩性, 动如脱兔;同时也提供了面向企业级应用的坚不可摧的高可用性,静若磐石。

本博客重点会围绕着Aurora Serverless V2的弹性伸缩和高可用特性,展开测试和分析,进一步向您展示Aurora Serverless V2的特点。

二、测试

2.1 扩展性测试

2.1.1 测试目标

  • Aurora Serverless V2 随负载变化的弹性伸缩能力
  • Aurora Serverless V2 与 V1弹性伸缩能力比较

 

Aurora Serverless 资源扩展以ACU为单位,关于ACU定义:

  • Aurora Capacity Unit (ACU)用于测量 Aurora Serverless所分配资源容量
  • 1个 ACU 有2 GiB 的内存,同时具有相应的CPU和网络等资源, CPU、网络和内存的配比与预置Aurora实例相同
  • Aurora Serverless V2启动容量可以最低设置成0.5 ACU(1 GiB 内存),最高ACU支持设置为128

2.1.2 测试结果和分析

模拟负载波峰波谷,采用sysbench 读写负载,基于不同线程压测 10/100/50/600/10,每轮 压测120秒,观测在初始20秒 Aurora Serverless V2/V1资源扩展情况:

轮次 线程数 测试结果观测 (V2/V1 Min ACU:4/Max ACU:32)
1 10

V2 随着负载启动 在第12秒开始扩展 ACU (由初始值min ACU:4 扩展至ACU:10)

V1 随着负载启动 在第120秒开始扩展ACU

V2:V1 ACU随负载变化 V2相比V1按需扩展速度提升10倍

V2 随着负载启动 按需扩展ACU 数据库引擎缓存池(innodb_buffer_pool_size)也随之变化

V2 随着ACU扩展 性能不断攀升 在第53秒趋于平稳

第一轮测试结束 V2 ACU扩展至10/Innodb_buffer_pool_size 扩展至10.21GB/ Max Connections  恒定保持3000 (max connections由max ACU值决定 整个测试max ACU=32没有变化)

2 100

V2 随着负载增加 在第7秒开始扩展 ACU

V1 从整个测试开始 在第120秒刚开始扩展ACU

V2 ACU 扩展 采用细粒度扩展 以0.5为增加单元

V1 ACU 扩展 采用翻倍扩展 4 扩展至8

第二轮测试结束 V2 ACU扩展至 17

3 50

此轮压测前 V2/V1 ACU 已经扩展至 17/8 已基本满足50线程压测

整轮测试 V2/V1 ACU相对比较平稳

第三轮测试结束 V2 ACU扩展至 22.5

4 600

在600线程高并发负载压测下 V1运行三次 尝试在30秒内启动运行 均未成功 sysbench 放弃 退出此轮测试

在600线程高并发负载压测下 V2运行三次 二次成功运行

V2 随着负载增加 在第8秒开始扩展 ACU

第四轮测试结束 V2 ACU扩展至 30

5 10

第五轮测试开始时 V2/V1 ACU已扩展至 30/16 已满足10线程压测需求

整轮测试 ACU和性能相对平稳

负载降低 V2 ACU 会逐步下降 相对于上升扩展 下降回缩速度会更加平稳 从压测结束 ACU降低到min  ACU:4 大致经历18分钟

测试过程中 CloudWatch Dashboard监控指标:

观测结果: V2 CPUUtilization与ServerlessDabaseCapacity 曲线拟合度非常高,ACU值随着CPU指标变化而变化,特别是负载上升期间 CPU上升 ACU可达到瞬间上升; CPU下降时 ACU值相对平稳下降

V1 ServerlessDabaseCapacity 扩展相对于CPUUtilization扩展有一定的延迟和滞后

 

V2/V1总体性能比较:

由于Aurora Serverless V2 系统扩展更敏捷 负载上升V2始终获得比V1更高的资源配置(ACU)因而Aurora Serverless V2相比V1 在不同压测场景 性能提升1.5-3 倍(TPS & QPS)  同时V2 采用MySQL 8.0  V1采用MySQL 5.7 版本不同 性能表现也会有所差异

扩展速度测试:

将V2 Min ACU 设置成8 ACU和4 ACU 查看ACU扩展速度是否有提升 测试负载sysbench 读写 线程数采用恒定值100 运行15分钟

运行次数 Min acu Max acu 线程数 ACU第n秒开始扩展
1 8 32 100 4 (第一次扩展至9)
2 4 32 100 14 (第一次扩展至10)

测试观察:

ACU 扩展速度 与Min ACU 或者当前数据库的ACU值相关  ACU值越大 扩展速度越快

2.1.3扩展性测试总结

  • Aurora Serverless V2 采用即时原地扩展 随负载变化可实现敏捷扩展  实现秒级ACU扩展
  • 实现细颗粒度资源扩展 以0.5ACU 为扩展单元
  • Aurora Serverless V2 ACU 资源扩展同时,其它相应资源, 例如数据库引擎缓存池innodb_buffer_pool也实现动态扩展
  • ACU 扩展速度 与min ACU 或者当前数据库的ACU值相关 ACU值越大 扩展速度越快
  • Aurora Serverless V2 资源扩展速度敏捷 回缩相对平稳 以保障系统负载平稳支撑
  • Aurora Serverless V2 vs V1
  • 总体性能提升5-3倍
  • 资源扩展速度提升10-15倍
  • 扩展单元更细粒度
  • 在高并发场景 可平稳运行

2.2读副本测试

Aurora Serverless V2增加了读副本功能 可以通过增加读副本 最多可创建15个读副本 实现跨AZ容灾以及读负载扩展; Aurora Serverless V2 的高failover优先级读副本(Tier 0/1)ACU会随着主节点ACU伸缩 从而保障在主从负载故障切换后 快速承载主节点负载;Aurora Serverless V2 低failover优先级读副本(Tier 2-15)ACU不会随着主节点ACU伸缩 会依据自身实例负载实现资源ACU伸缩

2.2.1 测试目标

  • Aurora Serverless V2 tier 0/1 读副本是否会随着主节点ACU扩展而扩展
  • Aurora Serverless V2 tier 2-15 读副本负载是否会独立主节点而扩展
  • Aurora Serverless V2 主从节点切换时间

2.2.2 测试结果和分析

创建一主两从Aurora Serverless V2集群 读副本failover级别分别为Tier 0和Tier 15 (Min ACU:4;Max ACU:32):

轮次 测试内容 测试结果观测
1 只在主节点添加sysbench读写压力

主节点ACU 随着sysbench压测变化 在不断发生变化, Tier 0的读副本的ACU也在随着主节点的ACU的变化不断变化, Tier 15的读副本的ACU不会随着主节点的ACU的变化而变化,在无负载的情况下,ACU持续平稳保持在4.

Tier 0的读副本CPU 并不会随着主节点的CPU变化而变化

2 在主节点添加恒定的sysbench读写压力(线程为100), 在Tier 15的读副本上 添加(线程为10)的恒定的sysbench只读压力

主节点ACU 随着sysbench压测变化 在不断发生变化, Tier 0的读副本的ACU也在随着主节点的ACU的变化不断变化,两者ACU值基本一致;

Tier 15的读副本的ACU会独立变化,不会随着主节点的ACU的变化而变化

3 在主节点手工做Failover 观测在多少时间主从切换至Tier 0 读副本 手动做failover 会切换到Tier 0读副本 切换时间大致6秒 (切换过程中 查询脚本有6秒获取不到信息)

2.2.3读副本测试总结

  • Aurora Serverless V2 通过读副本 可实现跨AZ 高可用性 主从切换时间在秒级
  • Aurora Serverless V2 通过读副本 实现读负载的水平扩展
  • Tier 0/1 读副本的ACU也在随着主节点的ACU的变化不断变化 两者ACU值基本一致 可保障主从切换后 资源充足供应
  • Tier 2-15读副本读副本的ACU会独立变化,不会随着主节点的ACU的变化而变化

2.3 全球数据库测试

Aurora Serverless V2增加了全局数据库功能 可以通过增加全局数据库 实现跨区域容灾以及就近本地读访问; 全球数据库采用物理复制方式以及通过亚马逊云科技跨区域主干网高效传输数据 使得跨区域数据复制延迟低 小于1秒;容灾发生时 可以在分钟级将从集群提升为主集群;一个主集群 可建最多达五个从集群 主从集群总共可以创建多达90个读副本

2.3.1 测试目标

  • Aurora Serverless V2 全球数据库: 主集群上运行读写负载 在从集群上运行只读负载 观测主从集群ACU 变化
  • Aurora Serverless V2 全球数据库: 在主集群上运行高并发只写负载 在从集群上观测主从集群复制延迟
  • Aurora Serverless V2 全球数据库:执行Managed Planned Failover操作观测Failover所需要时间

2.3.2 测试结果和分析

  • 主集群(4 ACU-32 ACU)在美东1
  • 从集群 (4 ACU – 32 ACU)在美西2
轮次 测试内容 测试结果观测
1 在主集群添加恒定的sysbench读写压力(线程为100), 在从集群添加(线程为10)的恒定的sysbench只读压力 从集群的ACU会随着自身负载变化而独立变化,不会随着主集群的ACU的变化而变化
2 在主节点添加恒定的sysbench只写压力(线程为100), 在从集群上观测复制延迟

随着主集群写负载上升 从集群的负载相对独立 不会随着主集群的负载上升

在主集群写压力比较大的情况下 主从集群复制延迟 保持在低位 在200毫秒左右

3 执行Managed Planned failover(从us-west-2切换回us-east-1) 观测主从切换所需时间 手动做failover从us-west-2切回到us-east-1并使从集群的cluster endpoint可用 总体切换时间大致3分钟

2.3.3全球数据库测试总结

  • Aurora Serverless V2 通过全球数据库 可实现跨Region 高可用性 主从切换时间在分钟级
  • Aurora Serverless V2 通过全球数据库实现跨区域容灾和就近数据访问
  • 从集群的ACU会随着自身负载变化而独立变化,不会随着主集群的ACU的变化而变化
  • 主从集群复制延迟比较低 通常保持在200毫秒左右

三、迁移数据库到Aurora Serverless V2

3.1 选择Aurora Serverless V2的理由

选择Aurora Serverless V2 有众多益处, 以下从四个方面概括阐述选择Aurora Serverless V2的理由:

  1. 高度可扩展

创新的云原生无服务数据库,实现数据库的弹性伸缩,进一步简化客户创建、维护和扩展数据库,实现高度扩展性及自动伸缩容量。

Amazon Aurora Serverless v2采用即时原地扩展技术,在扩展性方面比上一代更上一层楼,可以立即扩展以支持最苛刻的应用程序,瞬间扩展不到一秒时间,即可将数据库工作负载由支持几百个事务扩展至支持数十万个事务。

  1. 提供面向企业级应用高可用性

Aurora Serverless V2提供所有的 Aurora 功能,包括回溯、克隆、全球数据库、多可用区部署以及只读副本等,满足业务关键型应用程序的需求,可以通过创建只读副本实现跨多可用区高可用性,实现秒级跨可用区故障切换;可以通过创建全球数据库实现跨区域高可用性,实现分钟级跨区域故障切换,可提供面向企业级应用高可用性。

  1. 易管理

Aurora Serverless V2可按需自动扩展,根据应用程序的需求自动扩展或缩减容量,简化客户创建、维护和扩展数据库, 不再需要进行复杂的数据库容量预置和管理, 数据库会根据应用程序的需求自动扩展资源。

  1. 经济高效

Aurora Serverless V2可以以细粒度的0.5 ACU增量资源扩展,确保恰好提供应用所需的数据库资源量,并且仅为使用的容量付费,同时Aurora Serverless V2可按秒计费, 实现更细粒度计费模式。

3.2 如何迁移数据库到Aurora Serverless V2

版本要求:

Aurora Serverless V2 MySQL: Aurora MySQL 3.0.2及以上 (兼容MySQL 8.0)

Aurora Serverless V2 PostgreSQL: Aurora PostgreSQL 13.6及以上

迁移:

迁移场景1: 将预置模式Aurora集群迁移到Aurora Serverless V2

 

Aurora Serverless V2 支持集群里采用灵活的混合配置架构, 即主节点可以是预置模式实例, 读节点是Aurora Serverless V2实例; 同时也支持主节点是Aurora Serverless V2实例, 读节点是Aurora预置模式实例

迁移方法:创建Aurora Serverless V2混合配置架构 通过主从切换将预置模式主节点实例转换成Aurora Serverless V2实例:

 

  • 将Aurora 预置模式主节点升级到Aurora Serverless V2所需版本
  • 在集群级别设置Min ACU和Max ACU
  • 增加实例类型为Serverless读副本 (Failover级别:Tier 0/1)
  • 执行主从切换: Provisioned Writer变成Provisioned Reader; Serverless Reader变成 Serverless Writer

迁移场景2: 将Aurora Serverless V1迁移到Aurora Serverless V2

迁移方法:通过创建快照迁移

 

  • 基于Aurora Serverless V1创建快照
  • 基于快照恢复预置Aurora集群
  • 将Aurora 预置模式主节点升级到Aurora Serverless V2所需版本
  • 在集群级别设置Min ACU和Max ACU
  • 增加实例类型为Serverless读副本 (Failover级别:Tier 0/1)
  • 执行主从切换: Provisioned Writer变成Provisioned Reader; Serverless Reader变成 Serverless Writer

四、总结

本博客重点展示了Aurora Serverless V2作为新一代云原生数据库特点:高度可扩展性-动如脱兔,以及面向企业级应用高可用性-静若磐石;当云原生数据库Aurora深度融合无服务,必将数据库创新做到极致!

希望读完此博客的您, 能即刻构建,享用Aurora Serverless V2的创新,来构建您的面向未来的创新的现代化应用。

五、附录:整体测试过程

5.1测试环境

创建和安装两台EC2测试机 :

测试区域:us-east-1

测试端:

两台C5 4XLarge: AMI amzn2-ami-hvm (Root Device 100g)

安装和配置sysbench:

 

在两台EC2 测试机上 分别安装sysbench

sudo yum -y install git gcc make automake libtool openssl-devel ncurses-compat-libs
sudo yum -y install https://dev.mysql.com/get/mysql80-community-release-el7-3.noarch.rpm
sudo yum repolist
sudo rpm --import https://repo.mysql.com/RPM-GPG-KEY-mysql-2022
sudo yum -y install mysql-community-devel mysql-community-client mysql-community-common 
git clone https://github.com/akopytov/sysbench
cd sysbench
./autogen.sh
./configure
make
sudo make install
sysbench --version

5.2扩展性测试

5.2.1 测试环境准备

测试环境:

测试端

之前安装sysbench的两台EC2 C5 4XLarge

数据库 Min ACU Max ACU 集群名
Aurora Serverless V2 4 32 aurora-serverless-v2-demo
Aurora Serverless V1 4 32 aurora-serverless-v1

 

准备sysbench数据

 

  1. 分别在两台EC2 压测机准备 sh 设置相关环境变量
host=<Aurora Serverless V2/V1 endpoint>
username=<master user name>
password=<password>
run_time=200
interval=1

执行:

source set_variables.sh
  1. 在Aurora Serverless V2和V1库上 分别创建测试数据库demo
create database demo
  1. Sysbench准备数据 500张表 每张表5万行 总共5GB数据
sysbench --db-driver=mysql --mysql-user=${username} --mysql-password=${password} --mysql-db=demo --mysql-host=${host} --mysql-port=3306 --tables=500 --table-size=50000 --time=${run_time} --forced-shutdown --rand-type=uniform --db-ps-mode=disable --report-interval=${interval} --threads=50 /usr/local/share/sysbench/oltp_write_only.lua prepare
  1. 检查测试表状态和数据 总体测试数据5GB
/usr/bin/mysqlcheck -u ${username} -p${password} -h ${host} -P 3306 -a -B demo

--Connect and query table sizes
/usr/bin/mysql -u ${username} -p${password} -h ${host} -P 3306

SELECT TABLE_SCHEMA, count(TABLE_NAME) AS "Table count",
 sum(DATA_LENGTH/1024/1024/1024) AS "Data size in GB" FROM INFORMATION_SCHEMA.TABLES
 WHERE TABLE_SCHEMA='demo' GROUP BY TABLE_SCHEMA;

创建Cloudwatch Dashboard 为后续测试监控做准备:

 

Name: Aurora Serverless Monitor

在Dashboard Aurora Serverless Monitor创建6个Widgets:

编号 Widget Name 监控指标 指标说明
Widget 1 V2 CPUUtilization & ServerlessDatabaseCapacity Aurora Serverless V2 instance CPUUtilization 当前实例使用的CPU与Max ACU 分配的CPU的比例
Aurora Serverless V2 instance ServerlessDatabaseCapacity 当前实例分配的ACU
Widget 2 V1 CPUUtilization & ServerlessDatabaseCapacity Aurora Serverless V1 instance CPUUtilization 当前实例使用的CPU与当前分配机型CPU的比例
Aurora Serverless V1 instance ServerlessDatabaseCapacity 当前实例分配的ACU
Widget 3 V2 QueriesPerSec & ServerlessDatabaseCapacity Aurora Serverless V2 instance Queries 当前实例每秒钟执行的查询数
Aurora Serverless V2 instance ServerlessDatabaseCapacity 当前实例分配的ACU
Widget 4 V1 QueriesPerSec & ServerlessDatabaseCapacity Aurora Serverless V1 instance Queries 当前实例每秒钟执行的查询数
Aurora Serverless V1 instance ServerlessDatabaseCapacity 当前实例分配的ACU
Widget 5 V2 DBConnections & ServerlessDatabaseCapacity Aurora Serverless V2 instance DatabaseConnections 当前实例数据库连接数
Aurora Serverless V2 instance ServerlessDatabaseCapacity 当前实例分配的ACU
Widget 6 V2 DBConnections & ServerlessDatabaseCapacity Aurora Serverless V1 instance DatabaseConnections 当前实例数据库连接数
Aurora Serverless V1 instance ServerlessDatabaseCapacity 当前实例分配的ACU

 

5.2.2测试

  1. 分别在两台Ec2压测机上 准备sysbench压测脚本 读写测试 基于不同线程压测 10/100/50/600/10 不同线程规格压测120秒(2分钟) 每秒钟打印统计信息
$ cat sysbench_read_write.sh
#!/bin/bash
host= <Aurora Serverless V2/V1 endpoint>(请替换)
username=admin
password=<password>
interval=1
run_time=120
for threads in 10 100 50 600 10
do
echo "start ......................... `date` "
sysbench --db-driver=mysql --mysql-user=${username} --mysql-password=${password} --mysql-db=demo --mysql-host=${host} --mysql-port=3306 --tables=500 --table-size=50000 --time=${run_time} --forced-shutdown --rand-type=uniform --db-ps-mode=disable --report-interval=${interval} --threads=${threads} /usr/local/share/sysbench/oltp_read_write.lua run
echo "end ......................... `date` "
done
  1. 分别在两台Ec2压测机 准备监控脚本 每秒钟监控数据库动态变量 (innodb_buffer_pool_size和max_connections)
$ cat stats-loop.sh
host=< Aurora Serverless V2/V1 endpoint >
username=<master user name>
export MYSQL_PWD=<password>

while true; do /usr/bin/mysql -u ${username} -h ${host} -P 3306 -e "select NOW() AS 'Time',
@@max_connections AS 'Max Connections',
COUNT(host) as 'Current Connections',
round(@@innodb_buffer_pool_size/1024/1024/1024,2) AS 'Innodb Buffer Pool Size (GiB)',
COUNT AS 'InnoDB history length'
From information_schema.innodb_metrics,
information_schema.processlist
where name='trx_rseg_history_len'"; sleep 1; done
  1. 运行aws configure 配置id/key/region 为后续aws cli运行做准备
  2. 分别在两台Ec2压测机 准备监控脚本 每秒钟监控数据库ACU
$ cat stats-loop-acu.sh
cluster_name="aurora-serverless-v2-demo" (请替换成你的Aurora Serverless V2集群名字)
export LC_ALL=Cwhile true; do
aws cloudwatch get-metric-statistics —metric-name "ServerlessDatabaseCapacity" \
--start-time "$(date -d '5 sec ago')" —end-time "$(date -d 'now')" —period 1 \
--namespace "AWS/RDS" \
--statistics Average \
--dimensions Name=DBClusterIdentifier,Value=$cluster_name
sleep 1; done
  1. 分别在两台Ec2压测机 调用sysbench压测脚本 分别对Aurora Serverless V2/V1 进行线程10/100/50/600/10压测 每轮压测执行120秒 每秒钟跟踪Aurora Serverless V2/V1 数据库的Innodb_buffer_pool_size和max_connections大小 同时每秒钟跟踪Aurora Serverless V2/V1 数据库分配的ACU (整体测试运行3次)
$ cat run_sysbench.sh
sh sysbench_read_write.sh > $1_$2_sysbench.log &
sh stats-loop.sh > $1_$2_buffer_pool.log &
sh stats-loop-acu.sh > $1_$2_acu.log &
$1 – 参数1=V2/V1 (代表在V2还是V1上运行)
$2 – 参数2 = 1/2/3 (代表第几次执行)
示例:sh run_sysbench.sh 2 1 (表示针对Aurora Serverless V2 做第一轮测试) 测试输出三个log格式:v2_1_sysbench.log/v2_1_buffer_pool.log/v2_1_acu.log

sysbench整体测试结束后 从上面三个监控logs(sysbench.log/buffer_pool.log/acu.log) 整理每轮线程压测 前20秒信息 来进一步分析Aurora Serverless V2在系统负载变化时 是否可以实现按需敏捷扩展

sysbench线程10压测 :

  1. 测试数据整理(前20秒)
V1 ACU V2 ACU V1 TPS V2 TPS V1 Buffer Pool GB V2 Buffer Pool GB
1 4 4 36.94 9.98 2.99 3.07
2 4 4 71 6 2.99 3.07
3 4 4 87.02 12 2.99 3.07
4 4 4 88.01 10 2.99 3.07
5 4 4 91.99 16 2.99 3.07
6 4 4 91.97 17 2.99 3.07
7 4 4 92.04 17 2.99 3.07
8 4 4 92.99 21 2.99 3.07
9 4 4 86.96 24 2.99 3.07
10 4 4 83.04 27 2.99 3.07
11 4 4 86 30 2.99 3.07
12 4 10 72.99 35 2.99 3.07
13 4 10 92.98 38 2.99 7.36
14 4 10 97 39 2.99 10.21
15 4 10 97.04 41 2.99 10.21
16 4 10 94.98 46 2.99 10.21
17 4 10 95.99 52 2.99 10.21
18 4 10 74 63 2.99 10.21
19 4 10 93.03 72 2.99 10.21
20 4 10 97.98 75 2.99 10.21

sysbench线程100压测:

  1. 测试数据整理(前20秒)
V1 ACU V2 ACU V1 TPS V2 TPS V1 Buffer Pool GB V2 Buffer Pool GB
1 8 9.5 0 47.92 7.87 10.21
2 8 9.5 100.04 193.06 7.87 10.21
3 8 10 100 321 7.87 10.21
4 8 10 300 429.99 7.87 10.21
5 8 10 195 557.01 7.87 10.21
6 8 10 205 612 7.87 10.21
7 8 12 284 550 7.87 10.21
8 8 13.5 251 666.99 7.87 10.21
9 8 12.5 323.99 651.96 7.87 10.21
10 8 13.5 313 729.06 7.87 10.21
11 8 13.5 269.89 631 7.87 10.21
12 8 13.5 379.16 680.96 7.87 10.21
13 8 13 281.9 670.04 7.87 10.21
14 8 13 338.11 700.09 7.87 10.21
15 8 13 345.91 710.01 7.87 10.21
16 8 13.5 344.1 742.99 7.87 10.21
17 8 13.5 388 746 7.87 10.21
18 8 14 383 768.01 7.87 10.21
19 8 14 384 745 7.87 10.21
20 8 14 379.82 625 7.87 10.21

sysbench线程50压测 :

  1. 测试数据整理(前20秒)
V1 ACU V2 ACU V1 TPS V2 TPS V1 Buffer Pool GB V2 Buffer Pool GB
1 8 17 828.76 526.17 7.87 20.23
2 8 17.5 779.15 837.2 7.87 21.68
3 8 17.5 822 920 7.87 21.68
4 8 18 713.01 952.01 7.87 21.68
5 8 17.5 761 937.99 7.87 21.68
6 8 18 795 873 7.87 21.68
7 8 17.5 788 882 7.87 21.68
8 8 17.5 753 931 7.87 21.68
9 8 17.5 809.99 839 7.87 21.68
10 8 17.5 828 933 7.87 21.68
11 8 18 834 854.99 7.87 21.68
12 8 18 835 947 7.87 21.68
13 8 18 873.99 940 7.87 21.68
14 8 18 875 954 7.87 21.68
15 8 18.5 826.01 929 7.87 21.68
16 8 18.5 862 967 7.87 21.68
17 8 18.5 836 904 7.87 21.68
18 8 18 887.01 957 7.87 21.68
19 8 18.5 881.99 960 7.87 21.68
20 8 18.5 839.3 952 7.87 21.68

sysbench线程600压测 :

 

600线程 V2能运行 V1 不能成功运行
V2 ACU V2 TPS V2 Buffer Pool
1 22.5 0 28.93
2 22.5 0 28.93
3 22.5 0 28.93
4 22.5 0 28.93
5 22.5 69 28.93
6 22.5 1242.93 28.93
7 22.5 1693 28.93
8 23 1267.99 30.38
9 23 1287.96 30.38
10 23 1267.99 30.38
11 23 1375.06 30.38
12 23 1329.93 30.38
13 23 1247.97 30.38
14 23 1227.07 30.38
15 23 1204.01 30.38
16 23 1220 30.38
17 23 1315 30.38
18 23 1286 30.38
19 23 1265.98 30.38
20 23 1293.02 30.38

sysbench线程10压测:

V1 ACU V2 ACU V1 TPS V2 TPS V1 Buffer Pool GB V2 Buffer Pool GB
1 16 30 75.88 317.49 19.48 40.53
2 16 30 111 364.1 19.48 40.53
3 16 30 115.03 366 19.48 40.53
4 16 30 119 372 19.48 40.53
5 16 30 123 371 19.48 40.53
6 16 30 119.88 371 19.48 40.53
7 16 30 122.11 370 19.48 40.53
8 16 30 121.01 367 19.48 40.53
9 16 30 124 366 19.48 40.53
10 16 30.5 125.98 373 19.48 40.53
11 16 30.5 125.02 375 19.48 40.53
12 16 30.5 126.89 372 19.48 40.53
13 16 30.5 125.1 372 19.48 40.53
14 16 30.5 128.01 371 19.48 40.53
15 16 30.5 125 372 19.48 40.53
16 16 30.5 130 369 19.48 40.53
17 16 30.5 125 375 19.48 40.53
18 16 30.5 130 380 19.48 40.53
19 16 30.5 130.99 374 19.48 40.53
20 16 30.5 129.01 375 19.48 40.53

测试期间CloudWatch Dashboard监控指标:

观测结果: V2 CPUUtilization与ServerlessDabaseCapacity 曲线拟合度非常高 ACU值随着CPU指标变化而变化 特别是负载上升期间 CPU上升 ACU可达到瞬间上升; CPU下降时 ACU值相对平稳下降

观测结果: V2 QueriesPerSec与ServerlessDabaseCapacity 曲线拟合度比较高

观测结果: V2 DBConnections与ServerlessDabaseCapacity 曲线拟合度比较高

5.3读副本测试

5.3.1 测试环境准备

测试环境:

测试端

之前安装的Aurora Serverless V2测试机: EC2 C5 4XLarge

创建一主两从Aurora Serverless V2集群 读副本failover级别分别为Tier 0和Tier 15:

数据库 实例类型 Failover级别 Min ACU Max ACU 实例名
Aurora Serverless V2 主节点 4 32 aurora-serverless-v2-test-reader-replica-instance-1
读节点 Tier 0 4 32 aurora-serverless-v2-test-reader-reader1-failover-0
读节点 Tier 15 4 32 aurora-serverless-v2-test-reader-reader1-failover-15

准备sysbench数据:

连接到主节点 create demo database 准备sysbench测试数据 (500张表 每张表5万条记录 总共5GB数据)(具体步骤请参照上章测试)

创建Cloudwatch Dashboard 为后续测试监控做准备:

Dashboard Name: Aurora-Serverless-v2-reader

 

编号 实例名 监控指标 指标说明
1 aurora-serverless-v2-test-reader-replica-instance-1 Aurora Serverless V2 instance CPUUtilization 当前实例使用的CPU与Max ACU 分配的CPU的比例
2 aurora-serverless-v2-test-reader-replica-instance-1 Aurora Serverless V2 instance ServerlessDatabaseCapacity 当前实例分配的ACU
3 aurora-serverless-v2-test-reader-reader1-failover-0 Aurora Serverless V2 instance CPUUtilization 当前实例使用的CPU与Max ACU 分配的CPU的比例
4 aurora-serverless-v2-test-reader-reader1-failover-0 Aurora Serverless V2 instance ServerlessDatabaseCapacity 当前实例分配的ACU
5 aurora-serverless-v2-test-reader-reader1-failover-15 Aurora Serverless V2 instance CPUUtilization 当前实例使用的CPU与Max ACU 分配的CPU的比例
6 aurora-serverless-v2-test-reader-reader1-failover-15 Aurora Serverless V2 instance ServerlessDatabaseCapacity 当前实例分配的ACU

 

测试负载:

  • sysbench 读写负载 (具体测试脚本 请参照上章测试)
  • sysbench 只写负载 (请参考以下所附脚本)
  • sysbench 只读负载 (请参考以下所附脚本)

sysbench只写负载:(循环执行sysbench 只写负载 每次执行10分钟)

$ cat same_sysbench_only_write.sh
host="请替换成你的Aurora Endpoint "
username="admin"
password="****"
interval=1  
run_time= 600
threads=$1
while true  
do         
        echo $threads
echo "start ......................... `date` "
sysbench --db-driver=mysql --mysql-user=${username} --mysql-password=${password} --mysql-db=demo --mysql-host=${host} --mysql-port=3306 --tables=500 --table-size=50000 --time=${run_time} --forced-shutdown --rand-type=uniform --db-ps-mode=disable --report-interval=${interval} --threads=${threads} /usr/local/share/sysbench/oltp_write_only.lua run
echo "end ......................... `date` "
sleep 1
done

sh same_sysbench_only_write.sh 100 (参数为并发线程数)

sysbench只读负载:(循环执行sysbench 只读负载 每次执行10分钟)

$ cat same_sysbench_only_read.sh
host="请替换成你的Aurora Endpoint"
username="admin"
password="******"
interval=1  
run_time=600 
threads=$1
while true  
do         
echo "start ......................... `date` "
sysbench --db-driver=mysql --mysql-user=${username} --mysql-password=${password} --mysql-db=demo --mysql-host=${host} --mysql-port=3306 --tables=500 --table-size=50000 --time=${run_time} --forced-shutdown --rand-type=uniform --db-ps-mode=disable --report-interval=${interval} --threads=${threads} /usr/local/share/sysbench/oltp_read_only.lua run
echo "end ......................... `date` "
sleep 1
done
sh same_sysbench_only_read.sh 100 (参数为并发线程数)

5.3.2测试

测试场景1:

测试: 只在主节点添加sysbench读写压力:

测试场景2:

 

测试: 在主节点添加恒定的sysbench读写压力(线程为100), 在Tier 15的读副本上 添加(线程为10)的恒定的sysbench只读压力:

测试场景3:

测试: 在主节点手工做Failover 观测在多少时间主从切换至Tier 0 读副本:

执行stats-loop.sh (连接到主节点 持续查询主节点动态参数 innodb_buffer_pool_size 具体测试脚本 请参照前章测试内容)

5.4全局数据库 测试

5.4.1 测试环境准备

测试环境:

 

测试端

  • 之前美东1安装的Aurora Serverless V2测试机: EC2 C5 4XLarge
  • 美西2 新安装的Aurora Serverless V2测试机: EC2 C5 4XLarge 安装sysbench测试软件 (具体步骤 请参照前面章节)

数据库环境

  • 主集群(4 ACU-32 ACU)在美东1
  • 从集群 (4 ACU – 32 ACU)在美西2
数据库 区域 Min ACU Max ACU 集群名
Aurora Serverless V2 美东1 4 32 aurora-serverless-v2-global-database
Aurora Serverless V2 美西2 4 32 aws-serverless-v2-global-database-cluster-1

准备sysbench数据:

连接到主集群主节点 create demo database 准备sysbench测试数据 (500张表 每张表5万条记录 总共5GB数据)(具体步骤请参照前面章节)

创建Cloudwatch Dashboard 为后续测试监控做准备:

Dashboard Name: Aurora-Serverless-v2-reader

 

编号 集群名 监控指标 指标说明
1 aurora-serverless-v2-global-database Aurora Serverless V2 instance CPUUtilization 当前实例使用的CPU与Max ACU 分配的CPU的比例
2 aurora-serverless-v2-global-database Aurora Serverless V2 instance ServerlessDatabaseCapacity 当前实例分配的ACU
3 aws-serverless-v2-global-database-cluster-1 Aurora Serverless V2 instance CPUUtilization 当前实例使用的CPU与Max ACU 分配的CPU的比例
4 aws-serverless-v2-global-database-cluster-1 Aurora Serverless V2 instance ServerlessDatabaseCapacity 当前实例分配的ACU

 

测试负载:

    • sysbench 读写负载 (具体测试脚本 请参照前面章节)
    • sysbench 只写负载 (具体测试脚本 请参照前面章节)
    • sysbench 只读负载 (具体测试脚本 请参照前面章节)

5.4.2 测试

测试场景1:

测试: 在主集群添加恒定的sysbench读写压力(线程为100), 在从集群添加(线程为10)的恒定的sysbench只读压力:

测试场景2:

测试:在主节点添加恒定的sysbench只写压力(线程为100), 在从集群上观测复制延迟:

测试场景3:

测试: 执行Managed-failover(从us-west-2切换回us-east-1) 观测主从切换所需时间:

  • 连接到从集群cluster endpoint 持续运行脚本查询集群的max_connections信息 (请参照前面章节查询脚本)
  • 在主集群上 手动做managed-failover操作
  • 记录failover操作发生时间
  • 观测大致经过有多少时间 从集群能查询到信息

本篇作者

Bingbing Liu

刘冰冰,AWS 数据库解决方案架构师,负责基于 AWS 的数据库解决方案的咨询与架构设计,同时致力于大数据方面的研究和推广。在加入 AWS 之前曾在 Oracle 工作多年,在数据库云规划、设计运维调优、DR 解决方案、大数据和数仓以及企业应用等方面有丰富的经验。