¿Cómo monitoreo y soluciono problemas de retrasos de replicación al usar la réplica de lectura para una instancia de Amazon RDS for Oracle?

Última actualización: 18/11/2021

Quiero monitorear y solucionar problemas de retrasos de replicación cuando utilizo la réplica de lectura para mi instancia de base de datos de Amazon Relational Database Service (Amazon RDS) for Oracle.

Descripción corta

Puede configurar la réplica de lectura para su instancia de RDS for Oracle mediante la licencia Oracle Active Data Guard. Al crear una réplica de lectura para la instancia, las instancias de réplica principal y de lectura funcionan en el modo de rendimiento máximo de Data Guard. Para obtener más información, consulte la documentación de Oracle acerca de los modos de protección de Oracle Data Guard.

Puede usar la réplica de lectura para descargar las operaciones de lectura de la instancia principal. También puede promover la réplica de lectura como instancia de base de datos independiente en caso de recuperación de desastres. Para obtener más información, consulte Promoción de una réplica de lectura para convertirla en una instancia de base de datos independiente.

Antes de configurar una réplica de lectura para la instancia, asegúrese de verificar las limitaciones relacionadas con la versión y las licencias. Además, revise los distintos requisitos y restricciones para las réplicas de Oracle.

Resolución

Tenga en cuenta lo siguiente cuando utilice la réplica de lectura para la instancia de RDS for Oracle:

  • Amazon RDS es un servicio administrado. Por lo tanto, el proceso de replicación lo administra un usuario RDS_DATAGUARD interno. Este usuario se configura cuando crea una instancia de réplica de lectura.
  • No puede detener el proceso de recuperación administrada desde la cuenta de usuario administrador.
  • No puede configurar ni modificar la réplica de lectura de Oracle Data Guard Broker para RDS.
  • No puede retrasar la replicación de datos de una instancia principal a una instancia de réplica de lectura.
  • Las modificaciones que se llevan a cabo en el grupo de opciones se propagan a la instancia de réplica de lectura. Si las réplicas de lectura se configuran en la misma región, se asocian al mismo grupo de opciones. Para obtener más información, consulte Requisitos y restricciones de opciones para réplicas de Oracle.

Monitoreo del retraso en la replicación

Es posible que experimente un retraso en la replicación si la réplica no puede seguir el ritmo de la instancia principal. Para monitorear el retraso en la replicación en Amazon CloudWatch, observe la métrica ReplicaLag de Amazon RDS. Esta métrica muestra el retraso en la replicación en milisegundos. Para obtener más información, consulte Monitoreo de la replicación de lectura y Visualización de métricas y dimensiones de Amazon RDS.

Para monitorear y solucionar problemas de retraso en la replicación en Active Data Guard, siga estos pasos:

Ejecute la siguiente consulta para verificar las métricas de retraso de Data Guard:

sql > SELECT name,value,datum_time,time_computed FROM v$dataguard_stats;

Ejecute la siguiente consulta para verificar si hay un déficit de registro de archivo entre las instancias de réplica principal y de lectura:

sql >  SELECT archived.thread# THREAD,max(archived.sequence#) PRIMARY,max(applied.sequence#) STANDBY,(max(archived.sequence#) - max(applied.sequence#)) GAP FROM v$archived_log archived,v$archived_log applied WHERE archived.thread#=applied.thread# AND applied.applied='YES' GROUP BY archived.thread#;

Nota: RDS for Oracle no le alerta cuando hay un retraso en la replicación. Para enviar notificaciones cuando la réplica de lectura no siga el ritmo de la instancia principal, cree una alarma de CloudWatch para la métrica ReplicaLag de RDS.

Solución de problemas de retraso en la replicación

  • Si la instancia principal no está disponible, verifique el estado actual de la instancia mediante la consola de Amazon RDS. Además, verifique si se puede acceder a la instancia desde cualquier cliente SQL. Si la instancia principal no está disponible (por ejemplo: el estado de la instancia es incompatible-parameters [parámetros incompatibles]), la réplica de lectura no puede seguir el ritmo de la instancia principal y se queda atrás. Consulte Trabajar con eventos de Amazon RDS para averiguar por qué la instancia principal no está disponible. A continuación, corrija la instancia para asegurarse de que sea accesible.
  • Si la instancia principal está sometida a una sobrecarga elevada de CPU o memoria, puede producirse un retraso de transporte elevado. Monitoree las métricas de CloudWatch de la instancia. Además, puede usar Enhanced Monitoring para identificar si un proceso específico provoca un aumento inusual en el uso de la memoria o la CPU. Para obtener más información, consulte Visualización de métricas del SO en la consola de RDS. Cuando se reduce la carga de la CPU o la memoria, la réplica puede seguir el ritmo de la instancia principal. Si la sobrecarga es la esperada en la instancia, puede elegir escalar verticalmente la clase de instancia, las IOPS o el rendimiento según sea necesario.
  • Monitoree los archivos alert.log de la instancia principal y la réplica de lectura para identificar alertas o errores ORA que puedan afectar a los procesos de transporte o aplicación. Para obtener más información sobre el acceso al registro de alertas para instancias de RDS, consulte Archivos de registro de base de datos de Oracle. Resuelva los errores identificados para reducir el retraso.
  • Al cambiar el tamaño o el número de registros de rehacer en la instancia principal, los cambios no se replican en la instancia en espera. Para replicar estos cambios, debe volver a crear la instancia en espera. Se recomienda actualizar los parámetros del registro de rehacer antes de configurar la réplica de lectura. Para obtener más información, consulte Cambiar la configuración de registro.
  • Configurar la instancia de réplica de lectura con menos capacidad informática o de IOPS que la instancia principal podría ralentizar la aplicación de los cambios en la réplica de lectura, lo que provocaría un retraso en la replicación. Monitoree las métricas de RDS mediante CloudWatch para verificar si hay limitación controlada en ambas instancias. Si la instancia principal no tiene ninguna limitación controlada, pero sí sucede en la réplica de lectura, identifique el recurso que se está limitando. A continuación, escale verticalmente la configuración informática o de almacenamiento según sea necesario.