Publicado en: Oct 27, 2022

Amazon EMR admite PrestoDB y Trino para ejecutar análisis interactivos de SQL sobre grandes conjuntos de datos en múltiples orígenes de datos. Hoy, nos complace anunciar las últimas actualizaciones de PrestoDB y Trino incluidas en la versión 6.8 de EMR.

Con PrestoDB y Trino en EMR 6.8, los usuarios se benefician de la opción de configuración, denominada modo estricto, que evita sobrecostos debido a consultas de ejecución prolongada. Los clientes nos han dicho que las consultas de SQL mal escritas a veces pueden ejecutarse durante mucho tiempo y consumir recursos de otras cargas de trabajo críticas para el negocio. Para ayudar a los administradores a tomar medidas en estas consultas, estamos introduciendo una configuración “modo estricto” que permite advertir o rechazar ciertos tipos de consultas. Los ejemplos incluyen consultas sin predicados en columnas particionadas que dan como resultado exploraciones de tablas grandes, o consultas que implican uniones cruzadas (cross join) entre tablas grandes y/o consultas que ordenan una gran cantidad de filas sin límite. Puede establecer una configuración de modo estricto durante la creación del clúster y también anular la configuración mediante las propiedades de la sesión. Puede aplicar comprobaciones de modo estricto para seleccionar, insertar, crear una tabla como seleccionar y explicar los tipos de consulta de análisis.

También nos complace anunciar que PrestoDB y Trino de Amazon EMR han agregado nuevas funciones para manejar interrupciones puntuales que ayudan a ejecutar sus consultas de manera rentable y confiable. Las instancias de spot en Amazon EMR le permiten ejecutar cargas de trabajo de macrodatos en la capacidad adicional de Amazon EC2 a un costo reducido en comparación con las instancias bajo demanda. Sin embargo, Amazon EC2 puede interrumpir instancias de spot con una notificación de dos minutos. Las consultas de PrestoDB/Trino dan error cuando se terminan los nodos de spot. Esto significaba que los clientes no pudieron ejecutar dichas cargas de trabajo en instancias de spot y aprovechar los costos más bajos. En EMR 6.7, agregamos una nueva capacidad al motor PrestoDB/Trino para detectar interrupciones de spot y determinar si las consultas existentes pueden completarse en dos minutos en esos nodos. Si las consultas no pueden finalizar, aparece el error rápidamente y volvemos a intentar hacer las consultas en diferentes nodos. El motor PrestoDB/Trino de Amazon EMR tampoco programa nuevas consultas en los nodos de spot que están a punto de recuperarse. Con estas dos nuevas características, obtendrá lo mejor de ambos mundos: resistencia mejorada con el motor PrestoDB/Trino en Amazon EMR y ejecución de consultas de manera económica en nodos de spot.

Puede utilizar estas capacidades en todas las regiones donde PrestoDB y Trino de Amazon EMR están disponibles. Para obtener más información, consulte la sección Presto y Trino en la Guía de versiones de Amazon EMR.