Saltar al contenido principal

Amazon CloudWatch

Operaciones de IA

Aproveche la IA para identificar, diagnosticar y solucionar rápidamente los problemas operativos

Información general

Aproveche la amplia experiencia operativa que AWS ha acumulado y perfeccionado a lo largo de 19 años prestando servicios en la nube a millones de clientes en todo el mundo. Utilizamos la inteligencia artificial y el machine learning (ML) para ayudar a mejorar, acelerar y automatizar sus procesos de operaciones en la nube. AIOps le permite observar fácilmente sus cargas de trabajo, acelerar la resolución de problemas operativos y tomar medidas para resolver y corregir los problemas operativos, mejorando el tiempo promedio de recuperación (MTTR). 

Encuentre la causa raíz de los problemas en una fracción del tiempo

Inicie una investigación operativa desde cualquier lugar de la Consola de administración de AWS. Puede configurar Amazon CloudWatch para iniciar una investigación en cuanto suene una alarma o crear una investigación desde un chat de Amazon Q. CloudWatch trabaja junto a usted en la investigación, y le ayuda a identificar anomalías en sus aplicaciones y a generar hipótesis sobre la causa raíz de los problemas.

Inicie la demostración interactiva de Investigaciones de CloudWatch

Missing alt text value

Resolución rápida de los problemas mediante sugerencias de corrección

Amazon CloudWatch sugiere acciones correctivas para problemas comunes de AWS mostrando los runbooks de Automatización de AWS Systems Manager, los artículos de AWS re:Post y la documentación pertinentes. Ejecute el runbook para resolver el problema y poder hacer que sus aplicaciones críticas para la empresa vuelvan a estar en pleno funcionamiento rápidamente.

Lea acerca de las Investigaciones de Amazon CloudWatch en la documentación

Missing alt text value

Mejore continuamente su postura operativa

Amazon CloudWatch utiliza la inteligencia artificial para crear informes de análisis completos posteriores a los incidentes en cuestión de minutos. Los informes de incidentes lo ayudan a identificar mejor los patrones, implementar medidas preventivas y mejorar continuamente su postura operativa mediante un análisis estructurado posterior al incidente. Recopile y correlacione automáticamente los datos telemétricos operativos críticos, las configuraciones de servicio y los resultados de las investigaciones para generar informes detallados que impulsen mejoras operativas.  

Obtenga más información sobre el análisis y la generación automática de informes de incidentes en la documentación

Missing alt text value

Capacite a operadores de todos los niveles de experiencia

Amazon CloudWatch se encarga del pesado proceso de solución de problemas, por lo que no tiene que ser un experto en todos los recursos de las aplicaciones. Durante una investigación operativa, CloudWatch examina cientos de miles de puntos de datos para descubrir las relaciones entre los servicios y comprender cómo funcionan juntos. Tras analizar sus resultados, CloudWatch le presenta posibles hipótesis sobre la causa raíz del problema y lo guía sobre cómo resolverlo.

Ver un ejemplo de investigación

Missing alt text value

Detecte automáticamente anomalías y patrones

Amazon CloudWatch utiliza machine learning (ML) avanzado para establecer automáticamente bases de referencia y detectar anomalías en los datos de telemetría, lo que elimina la necesidad de examinar manualmente las métricas y los registros. Reciba alertas sobre picos o patrones inusuales para abordar los problemas antes de que se agraven. CloudWatch destaca los patrones recurrentes y los valores clave, como los niveles de gravedad, lo que le ayuda a concentrarse rápidamente en los registros relevantes o a comparar el comportamiento a lo largo del tiempo para detectar los problemas con mayor rapidez.

Lea acerca de la detección de anomalías de CloudWatch en la documentación

Missing alt text value

Consulte los datos de telemetría mediante lenguaje natural

Extraiga información de su telemetría sin necesidad de aprender lenguajes de consulta complejos. En lugar de escribir consultas complejas, puede simplemente hacer preguntas en lenguaje sencillo, como «Muéstrame las 10 solicitudes de AWS Lambda más lentas de las últimas 24 horas», y Amazon CloudWatch generará la sintaxis correcta automáticamente. Con la función de resumen en lenguaje natural de CloudWatch Logs Insights, puede generar resúmenes a partir de los resultados de las consultas para ayudarlo a identificar rápidamente los problemas y obtener información útil a partir de los datos de registro.

Lea cómo puede utilizar las consultas en lenguaje natural y el resumen en lenguaje natural en la documentación

Missing alt text value

Clientes

Cedar Gate Technologies

El proveedor de tecnología sanitaria Cedar Gate Technologies ahora puede identificar la causa raíz de los problemas operativos en unos 30 minutos, en lugar de dos horas, mediante Amazon CloudWatch para acelerar las investigaciones y resolver los problemas con rapidez, de modo que los clientes tengan continuidad y presten una atención valiosa a sus pacientes.

Missing alt text value

Amazon Kindle

Los ingenieros de soporte de Amazon Kindle han logrado resolver problemas entre un 65 y un 80 % más rápido al usar Amazon CloudWatch para realizar investigaciones, lo que les ha ayudado a abordar con mayor rapidez las necesidades de los clientes para ofrecer la mejor experiencia de usuario. 

Missing alt text value

Amazon Music

Los desarrolladores de Amazon Music utilizan Amazon CloudWatch como asistente las 24 horas del día, los 7 días de la semana, para automatizar las investigaciones e identificar las tendencias de los problemas, lo que les ayuda a avanzar más rápido durante sus turnos de guardia. El uso inicial demuestra que Amazon Music resuelve los problemas dos veces más rápido, por lo que los oyentes pueden seguir disfrutando de sus canciones favoritas.

Missing alt text value

SmugMug

La plataforma de administración fotográfica SmugMug utilizará Amazon CloudWatch para analizar automáticamente las métricas, los registros y los eventos operativos en sus sistemas, lo que les permitirá diagnosticar la mayoría de los problemas en menos de 20 minutos y hasta un 50 % más rápido. Esto mejora la eficiencia operativa al reducir las búsquedas manuales en los registros, de modo que su equipo puede dedicar menos tiempo y recursos a gestionar los problemas y más tiempo a crear la plataforma que ayude a los fotógrafos a hacer crecer sus escaparates digitales.

Missing alt text value