AWS PCS ahora proporciona una AMI de aprendizaje profundo lista para la producción
Hoy, AWS Parallel Computing Service (AWS PCS) lanza la AMI de aprendizaje profundo de AWS (DLAMI) lista para PCS, una imagen de máquina de Amazon que mantiene AWS basada en la AMI de GPU de Deep Learning Base (Ubuntu 24.04). Proporciona una base con calidad de producción para la formación en IA/ML y la computación de alto rendimiento (HPC), con los componentes principales de la infraestructura preinstalados y verificados para garantizar su compatibilidad.
AWS PCS es un servicio administrado que le facilita la ejecución y el escalado de sus cargas de trabajo de HPC y la creación de modelos científicos y de ingeniería en AWS mediante Slurm. Puede usar AWS PCS para crear entornos completos y elásticos que integren herramientas de computación, almacenamiento, redes y visualización. AWS PCS simplifica las operaciones de los clústeres con actualizaciones administradas y características de observabilidad integradas, lo que ayuda a eliminar la carga del mantenimiento. Puede trabajar en un entorno familiar, centrándose en la investigación y la innovación en lugar de preocuparse por la infraestructura.
La AMI hereda el sistema operativo, los controladores de GPU NVIDIA, el kit de herramientas de CUDA, los controladores EFA y el cliente Lustre de la AMI de GPU de Deep Learning Base de origen, y agrega el agente de PCS, Slurm para PCS y utilidades de EFS. Se incluyen varias versiones de Slurm compatibles y la versión correcta se activa automáticamente en función de la configuración del clúster. Puede agregar marcos, bibliotecas y software de aplicaciones a la parte superior para completar su entorno. AWS publica las AMI actualizadas con regularidad cuando se actualizan los componentes de DLAMI o PCS de origen, lo que proporciona parches de seguridad y actualizaciones de controladores continuos.
La DLAMI lista para PCS de AWS está disponible para las arquitecturas x86_64 y arm64 sin costo adicional en todas las regiones de AWS en las que AWS PCS está disponible. Para empezar, especifique una AMI lista para PCS al configurar los grupos de nodos de computación. Para obtener más información, consulte Uso de DLAMI lista para PCS en la Guía del usuario de AWS PCS. Para ver una arquitectura de clúster de referencia que se basa en la DLAMI lista para PCS, consulte el repositorio awsome-distributed-ai en GitHub.