Amazon Aurora MySQL 数据库配置最佳实践

Original URL: https://amazonaws-china.com/cn/blogs/database/best-practices-for-amazon-aurora-mysql-database-configuration/

在AWS Cloud当中迁移或启动新的Amazon Aurora MySQL实例之后，您是否考虑过以下几个问题？

“接下来该做什么？我该如何让实例保持最佳运行状态？”
“是否需要对现有参数做出修改？”
“具体该对哪些参数做出修改？”

如果这些问题确实困扰着您，希望本篇文章能给大家带来一点有意义的指导与启发。

在本文中，我们将探讨、阐述并总结Amazon Aurora（兼容MySQL）当中的参数配置建议。这些数据库参数本身及其取值，将在AWS Cloud内新创建或迁移实例的存留、调优及重新配置当中发挥重要作用。另外，我们还将讨论应该将Amazon RDS for MySQL中的哪些参数保留至Aurora实例当中。最后，本文还将论述参数的默认值、哪些参数对您实例的稳定性及性能优化至关重要等具体问题。

在执行变更之前，首先需要明确的就是变更背后的需求与动机。尽管大多数参数设置已经具有不错的默认值，但应用程序工作负载本身的变化可能要求我们对参数做出具体调整。因此在着手修改之前，请先回答以下几个问题：

当前是否存在稳定性问题，例如重新启动或者故障转移？
我能让应用程序的查询运行速度更快一些吗？

Aurora参数组快速入门

Aurora MySQL参数组分为两种类型：数据库参数组与数据库集群参数组。其中某些参数会对整个数据库集群的配置产生影响，例如二进制日志格式、时区与字集集默认值等。其他参数的影响范围则仅限于单一数据库实例。

在本文中，我们将结合不同的上下文对各项参数进行分类，聊聊哪些参数会影响Aurora集群的行为、稳定性及功能，而哪些参数会在变更之后影响性能表现。

需要强调的是，这两种参数类型都具有预设默认值，而且只有部分参数允许修改。

要深入了解参数组的修改与使用基础知识，请参阅《Aurora用户指南》中的以下主题：

在对生产数据库“下手”之前

参数变更往往会产生意想不到的结果，包括性能下降或者系统不稳定等。在对任何数据库配置参数做出变更之前，请首先思考以下最佳实践：

在测试环境中为生产实例创建克隆或还原快照（详见说明文档）。通过这种方式，您既获得高度近似于生产环境的测试条件，又不致对实际业务造成影响。
为测试实例生成可模拟生产工作负载的工作负载。
根据各项关键性能指标检查系统性能，具体包括CPU利用率、数据库连接数量、内存利用率、缓存命中率、查询吞吐量以及延迟等。请在执行变更之前提取这些基准数据，并在变更之后观察结果变化。
一次只变更一项参数，以避免发生歧义。
如果变更未能对测试系统产生可以直接测量的影响，请考虑将参数恢复为默认值。
记录哪些参数能够产生积极影响，以及哪些性能指标因变更而发生了切实改善。

默认参数值及其重要性

某些数据库实例参数当中包含变量或者公式，其值则由常量确定——例如实例大小、内存占用量、实例的网络端口及其分配到的存储容量等。大家最好不要变动这些设置，因为这些参数会随着实例的规模伸缩而自动调整。

例如，Aurora数据库参数innodb_buffer_pool_size的默认值为：

{DBInstanceClassMemory*3/4}

DBInstanceClassMemory 是一项变量，以GiB为单位设置为您实例的内存大小。

例如：对于拥有30.5 GiB内存的db.r4.xlarge实例来说，此值为20090716160 bytes，即18.71 GiB。

假如我们决定将此参数设置为一个固定值，例如18000000000 bytes，而后对db.r4.large实例执行缩容操作，那么实例总内存将降低至原本的一半（15.2 GiB）。在对数据库引擎的修改完成之后，我们很可能遭遇内存不足问题，并导致实例无法正确启动。

要快速浏览由系统变量自动计算得出的参数，大家可以在参数组定义中搜索这些参数，具体方法为：搜索大括号字符“{”。

如果您打算查询实例所使用的实际值，可以通过两种方式在命令行上实现。具体方法为使用SHOW GLOBAL VARIABLES 或者 SELECT语句：

mysql> SHOW GLOBAL VARIABLES where Variable_Name='innodb_buffer_pool_size';
+-------------------------+------------+
| Variable_name           | Value      |
+-------------------------+------------+
| innodb_buffer_pool_size | 8001683456 |
+-------------------------+------------+
1 row in set (0.01 sec)

mysql> SELECT @@innodb_buffer_pool_size;
+---------------------------+
| @@innodb_buffer_pool_size |
+---------------------------+
|                8001683456 |
+---------------------------+
1 row in set (0.00 sec)

参数值设置错误的症状与诊断

当某些参数发生设置错误时，有可能在MySQL错误日志中被记录为内存不足。在这种情况下，实例会进入滚动重启状态并生成类似于以下形式的事件日志，同时就需要调整的参数值提供相应建议：

2018-12-29 19:05:16 UTC  [-]MySQL has been crashing due to incompatible parameters. Please check your memory parameters, in particular the max_connections, innodb_buffer_pool_size, key_buffer_size, query_cache_size, tmp_table_size, innodb_additional_mem_pool_size and innodb_log_buffer_size. Modify the memory parameter and reboot the instance.

参数分类

在本文的讨论范围之内，我们将Aurora MySQL参数分为两大类：

负责控制数据库行为与功能，但对资源利用率及实例稳定性没有影响的参数。
通过管理实例中资源（例如缓存及基于内存内的缓冲区）的分配方式，对性能造成影响的参数。

下面，我们一起来看其中一部分具有代表性的参数、对应默认值，以及对它们做出修改后会给实例的行为或性能造成哪些影响。下表所示，为参数组中列出的参数名称、Aurora与MySQL默认值、以及受此参数影响的功能摘要。

参数名称	影响	Aurora默认值	MySQL 5.6/5.7默认值	参数描述
autocommit	功能	1 (ON)	1 (ON)	启用后，自动将事务提交至磁盘。如果禁用，则必须显式启动并提交或回滚多语句事务。如果某事务未明确启动，则自动提交每一条成功语句。
max_connections	功能	{变量}	{变量}	限制数据库并发连接的最大数量。
max_allowed_packet	功能	4194304 (bytes)	4194304 (bytes)	服务器能够接收的最大数据包大小。
group_concat_max_len	功能	1024 (bytes)	1024 (bytes)	服务器为GROUP_CONCAT() 函数返回的最大结果长度。
innodb_ft_result_cache_limit	功能	2000000000 (bytes)	2000000000 (bytes)	限制InnoDB全文搜索查询结果的缓存大小。
max_heap_table_size	功能	16777216 (bytes)	16777216 (bytes)	限制新用户所能定义的MEMORY表大小。不适用于已有表。
performance_schema	功能	OFF	OFF	启用或禁用MySQL Performance Schema。
binlog_cache_size	性能	32768 (bytes)	32768 (bytes)	控制二进制日志的缓存大小，增加此数值可提高系统的大事务处理性能。在具有大量数据库连接的环境中，请注意限制其数值。
bulk_insert_buffer_size	性能	–	–	控制MyISAM缓存大小以加快批量插入操作的速度。不适用于Aurora MySQL。
innodb_buffer_pool_size	性能	{变量} 实例内存的3/4	134217728 (128 MB)	控制InnoDB缓冲池内用于缓存表与索引数据的内存大小。
innodb_sort_buffer_size	性能	1048576 (bytes)	1048576 (bytes)	在向磁盘写入之前，定义排序操作从内存中加载多少数据。
join_buffer_size	性能	262144 (bytes)	262144 (bytes)	将用于联接、索引与范围扫描的缓冲区最小值。
key_buffer_size	性能	16777216 (bytes)	8388608 (bytes)	用于MyISAM表的键缓存。不适用于Aurora。
myisam_sort_buffer_size	性能	8388608 (bytes)	8388608 (bytes)	MyISAM索引缓冲区。不适用于Aurora。
query_cache_size	性能	{变量} 内存大小的1/24	1048576 (bytes)	为缓存结果集预留的内存容量，以1024的倍数表示。
query_cache_type	性能	1	0	启用或禁用查询缓存。
read_buffer_size	性能	262144 (bytes)	262144 (bytes)	控制多种缓冲区类型的内存分配，例如对ORDER BY子句、分区插入以及嵌套查询进行排序等情况。
read_rnd_buffer_size	性能	524288 (bytes)	262144 (bytes)	利用随机读取数据缓冲区改善系统性能。
table_open_cache	性能	6000	2000	限制内存中的基于所有线程的表开启数量。
table_definition_cache	性能	20000	{变量}不超过2000	在不使用文件描述的情况下，限制存储在缓存内的表定义数量。
tmp_table_size	性能	16777216 (bytes)	16777216 (bytes)	限制引擎中内存内临时表的大小。

建议与影响

下面我们对各项关键参数给数据库带来的具体影响做出简要说明，同时通过具体用例介绍这些参数的调整方式：

autocommit

推荐设置：使用默认值（1或ON）以保证每条SQL语句（除非属于由用户开启的事务的组成部分）在运行时可自动提交。

影响：将值设置为OFF可能导致使用模式错误，例如未决事务的打开速度减慢、未被关闭甚至无法正确提交。这会影响到数据库的性能与稳定性。

max_connections

建议设置：使用默认值（可变值）。在使用自定义值时，请保证只配置为应用程序实际用于任务执行的连接数量。

影响：将连接限制数量设置得过高，有可能占用更多内存容量，且其中大部分资源被浪费在未使用连接上。此外，这种设置还可能引发数据库连接峰值，进而影响数据库的性能与稳定性。

系统会根据您的实例内存分配方式与大小，利用以下公式自动填充此变量参数，因此建议您优先使用默认值：

GREATEST({log(DBInstanceClassMemory/805306368,2)*45},{log(DBInstanceClassMemory/8187281408,2)*1000})

例如，对于拥有15.25 GiB内存的Aurora MySQL db.r4.large实例而言，此项参数将被设置为1000：

DBInstanceClassMemory = 16374562816 bytes
max_connections = GREATEST({log(16374562816/805306368,2)*45},{log(16374562816/8187281408,2)*1000})
max_connections = GREATEST(195.56,1000) = 1000

如果遇到连接错误，且连接错误日志中显示大量Too many connections，可将此项参数设置为固定值（而非变量值）。

如果您的应用程序需要更多连接，因此有必要将max_connections设置为固定值时，请考虑在应用程序与数据库之间建立连接池或代理。这种方式同样适用于难以可靠预测或控制连接数量的场景。

当大家将这项参数手动配置为超过建议连接数的值时，Amazon CloudWatch中的数据库连接指标会在超出阈值的部分显示红线。CloudWatch的判断标准源自以下公式：

Threshold value for max_connections = {DBInstanceClassMemory/12582880}

例如，对于具有15.25 GiB内存（ 15.25 x 1024 x 1024 x 1024 = 16374562816 bytes）的db.r4.large实例，警戒阈值大约为1300条连接。当然，如果实例资源充足，您仍然可以使用配置中指定的最大连接数。

max_allowed_packet

建议设置：使用默认值（4194304 bytes）。仅在数据库工作负载有明确需求时，才使用自定义值。在处理会返回大元素（例如长字符串或BLOB）的查询时，请调整此项参数。

影响：在此处设置较大的值，并不会影响到消息缓冲区的初始大小。相反，此参数只是在查询负载增加时，允许系统将消息缓冲区扩容至预先定义的上限。如果设定较大的参数值，一旦出现大量合法的并发查询，则可能引发内存不足问题。

如果将此项参数设置得太小，则会显示以下错误：

ERROR 1153 (08S01) at line 3: Got a packet bigger than 'max_allowed_packet' bytes

group_concat_max_len

建议设置：使用默认值（1024 bytes）。仅在工作负载有明确需求时使用自定义值。具体而言，只在您希望变更GROUP_CONCAT()语句的返回值并允许引擎返回更长的列值时，才对此项参数做出调整。此值应与max_allowed_packet并行使用，后者负责确定响应的最大大小。

影响：将这项参数设置得过高，可能导致内存占用量过高以及内存不足等问题。而设置得太低则可能导致查询失败。

innodb_ft_result_cache_limit

建议设置：使用默认值（2000000000 bytes）。在工作负载有明确需求时使用自定义值。

影响：由于该值已经接近1.9 GiB，进一步增大该值有可能导致内存不足。

max_heap_table_size

建议设置：使用默认值（16777216 bytes）。限制用户在内存内创建表时指定的最大大小。变更此值只会影响新创建的表，原有表不受影响。

影响：将此参数设置过高会导致内存利用率提升，并在内存内表量激增时导致内存不足问题。

performance_schema

建议设置：由于会大量占用内存，请在t2实例上禁用此参数。

影响：在Aurora MySQL 5.6当中，系统已经通过启发式方式对Performance Schema内存进行了预分配。这项预分配以其他配置参数为基础，具体包括max_connections, table_open_cache及table_definition_cache等。在Aurora MySQL 5.7中，Perofmrance Schema内存采用按需分配模式。Performance Schema通常会消耗1到3 GB内存。如果数据库实例的内存不足，则启用Performance Schema有可能引发内存不足问题。

binlog_cache_size

建议设置：使用默认值（32768 bytes）。这项参数负责控制二进制日志缓存所能使用的内存量。调高这项参数可利用缓冲区避免大量磁盘写入，从而提升系统对大型事务的处理性能。此缓存按连接进行分配。

影响：对于数据库连接数量较大的环境，请控制此项参数以避免导致内存不足问题。

bulk_insert_buffer_size

建议设置：使用默认值，此参数并不适用于Aurora MySQL。

innodb_buffer_pool_size

建议设置：使用默认值（可变值），此参数在Aurora中被预配置为实例内存总量的75%。您可以在SHOW ENGINE INNODB STATUS的输出结果中查看缓冲池的使用情况。

影响：较大的缓冲池可在系统重复访问同一表内数据时减少磁盘I/O操作，进而提高整体性能。由于需要容纳InnoDB引擎本体，因此实际分配的内存量可能略高于实际配置值。

innodb_sort_buffer_size

建议设置：使用默认值（1048576 bytes）。

影响：高于默认值可能会给具有大量并发查询的系统带来整体内存压力。

join_buffer_size

建议设置：使用默认值（262144 bytes）。各种类型的操作（包括JOIN）中已经预先分配有该值，且单一查询可对缓冲区内的多个实例进行分配。如果需要提高联接性能，建议大家向相应表中添加索引。

影响：在具有大量并发查询的环境中，更改此参数可能带来严重的内存压力。即使增加索引，调高此值也无法实现更好的JOIN查询性能。

key_buffer_size

建议设置：使用默认值（16777216 bytes），因为此项参数与Aurora无关，且仅影响MyISAM表的性能。

影响：不会对Aurora性能造成影响。

myisam_sort_buffer_size

建议设置：使用默认值（8388608 bytes）。由于不会影响到InnoDB，因此这项参数不适用于Aurora。

影响：不会对Aurora性能造成影响。

query_cache_size

建议设置：使用默认值（可变值）。此项参数在Aurora中已经预先调整，且实际值远大于MySQL默认值。Aurora的查询缓存不会出现可扩展性问题（MySQL中的查询缓存同样不会出现此类问题）。但您也可以根据实际需求，修改此项参数以适应高吞吐量、高需求工作负载。

影响：通过此缓存访问查询时，会对查询性能造成影响。您可以在“QCache”部分下SHOW STATUS命令的输出结果中查看查询缓存的使用情况。

query_cache_type

建议设置：启用。在默认情况下，查询缓存在Aurora中处于启用状态，我们建议您保留这种启用状态，从而提高性能并降低运营成本。但如果您确定当前工作负载无法因此受益，则可禁用查询缓存。此类用例之一为高强度写入型工作负载，其中不涉及任何读取查询。

影响：如果您的工作负载会复用查询内容（例如可重复的SQL语句），那么在Aurora中禁用查询缓存可能会影响数据库性能。您可以在“QCache”部分SHOW STTUS命令的输出结果中查看查询缓存的使用情况。

read_buffer_size

建议设置：使用默认值（262144 bytes）。

影响：设置较大的值可提升整体内存压力，并可能导致内存不足问题。除非您确定能够在不损害系统稳定性的前提下改善性能，否则请不要调高此值。

read_rnd_buffer_size

建议设置：使用默认值（524288 bytes）。由于底层存储集群的性能特点，这里我们无需改动Aurora的默认设置。

影响：设置较大的值可能导致内存不足问题。

table_open_cache

建议设置：除非您的工作负载需要同时访问大量表，否则请不要改动此项参数。表缓存会占用大量内存，而Aurora中的默认值已经远高于MySQL默认值。此项参数会根据实例大小自动调整。

影响：对于包含大量表（数十万级别）的数据库，可能需要调高此项参数，这是因为某些表可能不适合保存在内存中。但将此值设置得过高可能导致内存不足。如果您启用了Performance Schema，此项设置也会间接影响到Performance Schema的可用内存量。

table_definition_cache

建议设置：使用默认值。此项参数在Aurora中的默认值已经远高于MySQL默认值，并会根据实例大小与类型进行自动调整。如果您的工作负载要求使用此参数，且数据库需要同时打开大量表，则调高参数可能会加快表开启操作的速度。此参数需要与table_open_cache配合使用。

影响：如果您启用了Performance Schema，此项设置也会间接影响到Performance Schema的可用内存量。如果使用高于默认值的设置量，可能会导致内存不足问题。

tmp_table_size

建议设置：使用默认值（16777216 bytes）。与max_heap_table_size配合，此项参数会限制用于查询处理的内存内表大小。当超出临时表容量上限时，表将被交换至磁盘。

影响：如果值设置得过高（数百MB以上）可能导致内存问题甚至内存不足。此项参数不会影响由MEMORY引擎创建的表。

结论与要点

在部署新的Aurora MySQL实例时，大部分参数已经完成预优化，足以作为后续参数变更前的良好基准。不同参数值的具体组合主要取决于系统实际情况、应用程序工作负载以及所需要的吞吐量等因素。此外，在变化率高、增长速度快、数据摄取量大且工作负载动态程度较强的数据库系统上，大家也需要对这些参数进行持续监控与评估。我们建议您每隔几个月（或者几周）进行一轮监控与评估，确保数据库始终适应应用程序与业务的实际需求。

要将参数调整成功转化为可量化的性能提升，我们建议您不断试验、建立基准并认真比较每变更后的性能结果。此外，我们还建议您在向实时生产系统提交变更之前，做好测试与性能比较工作。

如果您希望了解关于特定参数的更多详细信息，请参阅AWS支持文档或联系AWS技术客户团队。

亚马逊AWS官方博客