P. ¿Qué es un clúster elástico de HPC?

Un clúster elástico ofrece un entorno de HPC con la misma apariencia que un clúster de HPC convencional, pero con el beneficio adicional de ser escalable: los trabajos se envían a una cola y los nodos se inician según sea necesario, los trabajos se lanzan automáticamente a medida que se inactivan y los nodos se cierran automáticamente cuando ya no son necesarios.

P. ¿Cuáles son los beneficios de utilizar Amazon Web Services para HPC?

Los productos de AWS son elásticos. En vez de pagar un alto costo de capital por anticipado, solo paga por lo que usa. Si se lanza un clúster con 1000 núcleos durante un día, solo se paga ese día. Además, un clúster basado en la nube ofrece un acceso continuo al hardware más reciente y la oportunidad de personalizar cada clúster para la aplicación que se ejecutará en el hardware. Muchos clientes de HPC de AWS crean (y eliminan) clústeres todos los días. AWS funciona en un gran número de regiones geográficas, cada una compuesta por varias zonas de disponibilidad de gran escala que incluyen uno o más centros de datos. Esto permite a los clientes de AWS acceder fácilmente a volúmenes eficientes y sin límite de capacidad de cómputo en la ubicación que elijan.

P. ¿Cuáles son mis opciones para ejecutar aplicaciones de HPC en AWS?

Existen muchas soluciones de HPC comerciales y de código abierto compatibles con AWS. Muchos usuarios de HPC eligen comenzar con AWS ParallelCluster y personalizan el software para satisfacer sus necesidades específicas. Otros usuarios de HPC podrían preferir implementar las instancias informáticas manualmente o utilizar sus propios scripts que invoquen las API de EC2 con la CLI de AWS. Para algunos usuarios, una opción de SaaS completamente administrada podría ser una estrategia más conveniente. Todas estas opciones son posibles y los clientes de AWS las utilizan. 

P. ¿Qué es AWS ParallelCluster?

AWS ParallelCluster es una herramienta que permite crear y lanzar una plantilla de AWS CloudFormation. Es una aplicación escrita en Python que llama a los servicios de AWS, incluidos Amazon EC2, Amazon EBS y Amazon S3. También utiliza Amazon SQS, Amazon DynamoDB, Amazon CloudWatch y AWS CloudFormation para monitorizar y mantener el clúster. Para obtener más información, consulte la documentación de AWS ParallelCluster

P. ¿Cuáles son los beneficios de utilizar AWS ParallelCluster para ejecutar mi aplicación de HPC?

AWS ParallelCluster ofrece acceso rápido a un entorno de clúster con una variedad de herramientas de desarrollo de software, un disco compartido y una selección de capacidades de monitorización de ejecución, instancias y software de programación. AWS ParallelCluster pone en cola el software lanzado por varios usuarios. Además, los entornos lanzados por AWS ParallelCluster están completamente configurados para ejecutar aplicaciones de MPI con las características de red mejoradas de AWS.

P. ¿Cuánto cuesta el software de AWS ParallelCluster?

CfnCluster es una herramienta gratuita de código abierto creada por AWS.

P. ¿Cuál será el costo de los recursos de AWS en mi clúster de HPC?

Después de la implementación, se incurre en costos de infraestructura de AWS, que incluyen el costo de la instancia principal, los nodos informáticos, los volúmenes de EBS y cualquier almacenamiento de Amazon S3 utilizado. Para obtener más información, consulte Servicios utilizados y costos.

P. ¿Qué sucede si mi aplicación necesita configuraciones de infraestructura diferentes? ¿Puedo probar opciones fácilmente con AWS ParallelCluster?

Sí, AWS ParallelCluster es especialmente adecuado para probar opciones, ya que su clúster se puede reconfigurar de manera fácil en base a sus necesidades y a medida que estas se modifiquen. Además, el archivo de configuración pcluster se puede someter a control de versiones para documentar la configuración utilizada en cada opción probada. Cuando se busca el mejor rendimiento o el menor costo, AWS ParallelCluster facilita el proceso de probar diferentes aspectos de configuración de clústeres, como el tipo de instancia, el sistema operativo y las configuraciones de almacenamiento.