AWS Parallel Computing Service ahora es compatible con Slurm 25.11
AWS Parallel Computing Service (AWS PCS) ahora es compatible con la versión 25.11 de Slurm, con soporte para un punto de conexión de OpenMetrics compatible con Prometheus, e introduce nuevos tipos de registro, incluidos los registros de auditoría del programador.
Esta versión de Slurm 25.11 introduce la reincorporación acelerada a la cola, que puede reprogramar automáticamente los trabajos afectados por problemas con los nodos con la máxima prioridad para ayudar a que las cargas de trabajo se recuperen más rápido. Puede habilitar un nuevo punto de conexión de OpenMetrics para obtener visibilidad en tiempo real de los trabajos, los nodos y la programación utilizando sus herramientas de monitoreo existentes. AWS PCS ahora también puede enviar los registros del daemon de la base de datos de Slurm (slurmdbd) y del daemon de la API de REST (slurmrestd) a los registros de Amazon CloudWatch, Amazon S3 o Amazon Data Firehose, lo que ayuda a diagnosticar problemas de contabilidad y depurar las integraciones de API. Los registros de auditoría del programador, que antes se incluían en los registros operativos, ahora se entregan como un tipo de registro dedicado, lo que proporciona un control independiente de los costos de ingesta y almacenamiento.
AWS PCS es un servicio administrado que facilita la ejecución y el escalado de sus cargas de trabajo de computación de alto rendimiento (HPC) y la creación de modelos científicos y de ingeniería en AWS mediante Slurm. Puede usar AWS PCS para crear entornos completos y elásticos que integren herramientas de computación, almacenamiento, redes y visualización. AWS PCS simplifica las operaciones de los clústeres con actualizaciones administradas y características de observabilidad integradas, lo que ayuda a eliminar la carga del mantenimiento. Puede trabajar en un entorno familiar, centrándose en la investigación y la innovación en lugar de preocuparse por la infraestructura.
Estas características están disponibles en todas las regiones de AWS en las que AWS PCS está disponible. Se aplican cargos estándar a los destinos de entrega de registros. Para obtener más información sobre AWS PCS, consulte la documentación del servicio.