P: O que é um cluster elástico de HPC?

Um cluster elástico oferece um ambiente de HPC com a mesma aparência de um cluster convencional de HPC, mas com o benefício adicional da escalabilidade. Os trabalhos são enviados a uma fila, os nós são iniciados conforme a necessidade, os trabalhos são iniciados automaticamente em nós ociosos e nós desnecessários são encerrados automaticamente.

: Quais são os benefícios do uso da Amazon Web Services para HPC?

A AWS é elástica. Em vez de um grande custo de capital inicial, você paga apenas pelo que usar. Inicie um cluster com 1.000 núcleos por apenas um dia e pague somente por esse dia. Além disso, um cluster baseado na nuvem permite acesso contínuo ao hardware mais recente e a oportunidade de personalizar cada cluster para o aplicativo executado no hardware. Muitos clientes de HPC da AWS iniciam e encerram cluster todos os dias. A AWS opera em um grande número de regiões geográficas. Cada uma delas conta com várias zonas de disponibilidade de grande escala, compostas por um ou mais datacenters. Isso permite que os clientes da AWS acessem facilmente capacidade computacional praticamente ilimitada no local que escolherem.

P: Quais são as opções para a execução de aplicativos de HPC na AWS?

Há diversas soluções de HPC de código aberto e comerciais compatíveis com a AWS. Muitos usuários de HPC preferem começar com o AWS ParallelCluster, personalizando o software de acordo com suas necessidades específicas. Outros usuários de HPC podem preferir implantar instâncias de computação manualmente ou usando os próprios scripts para invocar APIs do EC2 usando a AWS CLI. Para alguns usuários, uma oferta de SaaS totalmente gerenciada pode ser a abordagem preferida. Todas essas opções são viáveis e usadas por clientes da AWS. 

P: O que é o AWS ParallelCluster?

O AWS ParallelCluster é uma ferramenta para criar e iniciar um modelo do AWS CloudFormation. Ele é um aplicativo Python que chama serviços da AWS, como Amazon EC2, Amazon EBS e Amazon S3. Ele também usa Amazon SQS, Amazon DynamoDB, Amazon CloudWatch e AWS CloudFormation para monitorar e manter o cluster. Para obter mais informações, consulte a documentação do AWS ParallelCluster

P: Quais são os benefícios do uso do AWS ParallelCluster para executar meu aplicativo de HPC?

O AWS ParallelCluster oferece acesso rápido a um ambiente de clusters com diversas ferramentas de desenvolvimento de software, um disco compartilhado, várias opções de software de agendamento e recursos de monitoramento de instâncias e execuções. O AWS ParallelCluster enfileira softwares iniciados por diversos usuários. Além disso, os ambientes iniciados pelo AWS ParallelCluster são totalmente configurados para executar aplicativos de MPI usando os recursos avançados de rede da AWS.

P: Qual é o custo do software AWS ParallelCluster?

O CfnCluster é uma ferramenta gratuita de código aberto criada pela AWS.

P: Quais serão os custos dos recursos da AWS em um cluster de HPC?

Após a implantação, serão cobrados os custos normais de infraestrutura da AWS, que incluem o custo da instância principal, dos nós de computação, dos volumes do EBS e de todo o armazenamento do Amazon S3 utilizado. Para obter mais informações, consulte Serviços usados e custos.

P: E se meu aplicativo precisar de configurações de infraestrutura diferentes? É fácil fazer experimentos com o AWS ParallelCluster?

Sim. O AWS ParallelCluster é particularmente adequado a experimentações, pois o cluster pode ser facilmente reconfigurado à medida que suas necessidades evoluem. Além disso, o arquivo de configuração pcluster pode ser colocado no controle de versões para documentar a configuração usada para cada experimento. Quando se busca pela melhor performance ou pelo menor custo, o AWS ParallelCluster facilita testar aspectos de configuração de cluster diferentes, como tipo de instância, sistema operacional e configurações de armazenamento.