Publicado en: Nov 19, 2020
AWS ParallelCluster es una herramienta de administración de clústeres de código abierto mantenida y totalmente compatible. Esta herramienta facilita a científicos, investigadores y administradores de TI la implementación y administración de clústeres de informática de alto rendimiento (HPC) en la nube de AWS. Los clústeres de HPC son conjuntos de recursos de redes, almacenamiento e informática estrechamente acoplados que permiten a los clientes ejecutar cargas de trabajo científicas y de ingeniería a gran escala.
Las mejoras significativas en las características de esta última versión de AWS ParallelCluster incluyen:
- Compatibilidad con instancias P4d: los clientes ahora pueden seleccionar instancias P4d para utilizar en los clústeres. Estas instancias incluyen compatibilidad con el acceso remoto directo a memoria (RDMA) GPUDirect de NVIDIA habilitado a través de Elastic Fabric Adapter, que puede acelerar aplicaciones estrechamente acopladas mediante la biblioteca de comunicaciones colectivas (NCCL) de NVIDIA para la comunicación de GPU a GPU. Esta opción se puede habilitar mediante el nuevo ajuste de configuración enable_efa_gdr.
- Compatibilidad con el sistema operativo CentOS 8: los clientes ahora pueden elegir CentOS 8 como sistema operativo base de preferencia para ejecutar los clústeres tanto para arquitecturas Arm como x86. Al igual que con otros sistemas operativos compatibles con AWS ParallelCluster, puede elegir el sistema operativo mediante la opción de configuración base_os. Además, puede optar por crear y usar una AMI propia personalizada sobre la base de CentOS 8. La compatibilidad con CentOS 8 también incluye compatibilidad con todos los programadores admitidos de AWS ParallelCluster y NICE DCV para la visualización remota.
- Panel de métricas de clúster de Amazon CloudWatch: los clientes pueden hacer un seguimiento de las métricas operativas correspondientes a los clústeres y visualizarlas en CloudWatch. Esto incluye métricas como la utilización de la CPU y la red, las operaciones de lectura y escritura de datos del sistema de archivos y las operaciones de lectura y escritura de los volúmenes de Amazon Elastic Block Store. Los clientes pueden utilizar este panel para visualizar el uso del clúster o identificar los cuellos de botella de rendimiento para diagnosticar la mejor manera de mejorar el rendimiento del clúster.
AWS ParallelCluster está disponible sin cargo adicional. Solo paga por los recursos de AWS necesarios para ejecutar sus aplicaciones. Descubra cómo lanzar un clúster de HPC con AWS ParallelCluster aquí.
Para obtener información más detallada, puede encontrar las notas completas acerca de la última versión de AWS ParallelCluster aquí.