Pular para o conteúdo principal

O que é computação de alta performance da AWS?

A computação de alta performance (HPC) é uma estratégia de infraestrutura de TI que combina grupos de sistemas computacionais para realizar cálculos simultâneos e complexos em trilhões de pontos de dados. Um único sistema de computação tem sua capacidade de processamento limitada por seu hardware e é menos útil na execução de simulações em áreas como modelagem climática, descoberta de medicamentos, pesquisa genômica e muito mais. As tecnologias de HPC podem usar vários sistemas de computação em paralelo para aumentar exponencialmente a velocidade de processamento.

Nos últimos anos, as tecnologias de HPC evoluíram da execução de simulações científicas para a execução de modelos de IA e workloads em grande escala.

Quais são os casos de uso de HPC?

Existem vários casos de uso de computação de alta performance no meio acadêmico, na indústria e nas empresas.

Mídia e entretenimento

Clusters de alta performance fornecem a potência computacional necessária para renderizar vídeos e gráficos 3D, transmitir eventos ao vivo com alta qualidade de vídeo e processar CGI. Os clusters de HPC permitem que as empresas de mídia reduzam os prazos de produção, agilizem a codificação de vídeo e reduzam os custos no processo de produção.

Saúde e genômica

O setor de saúde usa a HPC de várias maneiras, desde o sequenciamento do genoma até a previsão da estrutura de proteínas, e até mesmo em iniciativas de descoberta de medicamentos. Modelos baseados em IA executados em clusters de HPC ajudam ainda mais a melhorar a pesquisa e a adoção de medicamentos.

Nos hospitais, a computação de alta performance trabalha junto com o software de IA para ajudar a identificar doenças em exames de imagem, criar planos de tratamento médico personalizados e otimizar o gerenciamento de registros médicos.

Governo e defesa

A computação de alta performance é uma tecnologia de suporte que fornece recursos para várias soluções de defesa, como criptografia, vigilância em tempo real, análise de inteligência e detecção de ameaças. O acesso a um sistema de recursos escalável ajuda a garantir que os governos tenham o poder computacional necessário para realizar iniciativas de segurança nacional, simulações militares e muito mais.

Modelagem climática

Simular o fluxo de sistemas de fluidos em toda a Terra, para relatórios meteorológicos e para gerar dados climáticos, requer o processamento simultâneo de enormes quantidades de dados. A HPC oferece o poder de computação necessário para assimilar e processar dados rapidamente, ajudando a fornecer insights às agências que preveem desastres naturais, monitoram sistemas climáticos e preveem mudanças climáticas de longo prazo.

Serviços financeiros

Serviços financeiros, como fundos hedge, agências de seguros e bancos, usam a HPC para processar os dados necessários para executar modelos de previsão, prever riscos de crédito e otimizar portfólios. O poder de computação que a HPC oferece melhora o data analytics com insights em tempo real.

Setor automotivo

A computação de alta capacidade é uma tecnologia vital em dinâmica computacional de fluidos, testes de materiais e testes de simulação de colisão para a indústria automotiva. A HPC oferece prototipagem rápida e otimizações de designs em tempo real, além de ajudar a simular fluxos de trabalho de fábrica. A HPC também é uma tecnologia central em carros autônomos e na tomada de decisões baseada em visão computacional em tempo real.

Segurança cibernética

A computação de alta performance permite que os administradores de rede analisem o tráfego para detectar anomalias e identificar possíveis ameaças antes que elas ocorram. A HPC também fornece recursos computacionais para criptografia, avaliações de todo o sistema e neutralização de ameaças em tempo real.

Como funciona a HPC?

A computação de alta performance agrega o poder computacional de vários servidores, computadores ou estações de trabalho individuais para fornecer uma solução mais robusta. Esse processo de muitos nós trabalhando juntos é conhecido como computação paralela. Cada máquina individual nesse sistema é chamada de nó, com muitos nós se unindo para formar um cluster. Cada nó do sistema é responsável por gerenciar uma tarefa diferente, e todos trabalham em paralelo para aumentar a velocidade de processamento.

Nós de cluster

As soluções de HPC incluem alguns tipos de nós

  • Os nós controladores coordenam o trabalho em todo o sistema de clusters mais amplo.
  • Os nós de processamento, ou nós de computação, realizam qualquer processamento.
  • Os nós interativos, ou nós de login, permitem que os usuários se conectem ao sistema de HPC usando a linha de comandos ou uma GUI.

Os clusters de HPC podem ser heterogêneos, quando cada nó oferece hardware diferente, ou homogêneos, quando cada nó tem uma capacidade de performance semelhante.

Estruturas de cluster de HPC

Há duas estruturas principais de cluster de HPC.

Computação em cluster

A computação em cluster, também conhecida como computação paralela, é quando uma coleção de clusters trabalham em conjunto em uma função similar e em um local similar. Essa estrutura minimiza a latência entre os nós por ter uma topologia de rede semelhante e estar fisicamente próxima.

Computação distribuída

A computação distribuída pode usar clusters que estão em um local similar ou distribuídos em todo o mundo. Esse formato de cluster pode se basear em hardware on-premises junto com recursos de nuvem, fornecendo uma abordagem mais flexível e escalável à HPC. 

Como funcionam os trabalhos de HPC?

Os sistemas de HPC executam dois tipos diferentes de processos, conhecidos como workloads com acoplamento fraco e com acoplamento forte.

Workloads com acoplamento fraco

Workloads com acoplamento fraco são tarefas que um sistema de HPC realiza independentemente de outras funções que podem ocorrer em paralelo no sistema. Muitas tarefas independentes ocorrem simultaneamente, portanto, essa forma de processamento de HPC às vezes é chamada de trabalhos de workloads paralelas.

Por exemplo, ao renderizar um vídeo, cada quadro atua como uma tarefa diferente. Embora cada nó que renderiza um quadro possa ser extraído do mesmo armazenamento, sua capacidade de concluir a tarefa não depende de nenhum outro nó concluir sua tarefa.

Workloads com acoplamento forte

Workloads com acoplamento forte são tarefas de processamento de HPC que dependem umas das outras para concluir o trabalho geral. Essas workloads usam a memória e o armazenamento compartilhados de um cluster para compartilhar informações entre todos os nós do cluster, ajudando cada um a concluir simultaneamente sua tarefa. Workloads com acoplamento forte geralmente exigem uma coordenação em tempo real, com muitos nós trabalhando para fornecer pequenas informações para concluir uma tarefa maior. Por exemplo, cada nó pode ser responsável por simular um componente físico distinto em uma previsão do tempo, e a combinação de informações de todos os nós é necessária para renderizar a previsão final do tempo.

O que é HPC na nuvem?

A computação de alta performance na nuvem permite que as empresas aproveitem as soluções de HPC sem precisar gerenciar o cluster de HPC que utilizam. Em vez de criar um data center on-premises caro, a HPC na nuvem é uma solução econômica que oferece às empresas a capacidade computacional escalável de que precisam.

Há três tendências convergentes que aceleraram a expansão dos serviços de nuvem de HPC.

Rede RDMA de baixa latência

O uso do acesso remoto direto à memória (RDMA) permite que os nós de rede acessem a memória sem precisar usar o sistema operacional. Essa abordagem garante que um nó possa interagir com outro sem interromper seus processos, removendo gargalos do processo, minimizando a latência e maximizando o throughput.

Aumento da demanda por computação em nuvem

Devido à grande variedade de casos de uso de HPC, muitas empresas de vários setores agora precisam de serviços de HPC. A HPC na nuvem permite que essas empresas acessem serviços de HPC sem precisar criar seus próprios data centers, tornando essa tecnologia significativamente mais acessível.

Uso generalizado de IA

Outra causa do aumento da demanda por serviços de nuvem de HPC é o uso generalizado de software de IA e machine learning. As ferramentas de IA generativa precisam de muito poder de computação, com a HPC fornecendo os recursos computacionais e a escalabilidade desses sistemas. A HPC é uma solução eficaz para empresas que desejam utilizar ferramentas de IA em escala empresarial.

Quais são os benefícios da HPC na nuvem?

Há vários benefícios em executar a HPC na nuvem.

Gerenciamento unificado e remoto

Cada projeto de HPC tem requisitos de infraestrutura exclusivos. A compra automática restringe a organização a algumas configurações selecionadas em que ela pode investir. No entanto, a nuvem de HPC permite que as organizações escolham e combinem diversas configurações de armazenamento, computação, redes, nós de login, GPUs e estações de trabalho, conforme necessário para o projeto. Elas podem usar um console de gerenciamento para interagir com todos esses sistemas de um local central. Isso simplifica os fluxos de trabalho e automatiza as funções do cluster para maior comodidade.

Escalabilidade e provisionamento dinâmicos de recursos

Os sistemas de computação em nuvem de alta performance permitem que as empresas escalem o uso de recursos computacionais de forma dinâmica, aumentando ou reduzindo a escala verticalmente sem esforço para atender à demanda. Essa flexibilidade melhora a eficiência e otimiza o uso de recursos.

Atualizações gerenciadas

As workloads de HPC gerenciadas por provedores de computação em nuvem emitem atualizações automaticamente para manter seus sistemas atualizados. Essa abordagem garante que suas soluções de HPC estejam sempre atualizadas e ofereçam o serviço mais eficaz possível.

Flexibilidade para usar aplicações personalizadas

As empresas podem migrar suas aplicações para o provedor de nuvem. Elas podem personalizar o sistema operacional e o software pré-instalado para atender aos requisitos específicos da workload.

Como a AWS pode oferecer apoio aos seus requisitos de HPC?

Os serviços totalmente gerenciados de HPC da AWS permitem que você acelere a inovação com uma infraestrutura de nuvem de HPC virtualmente ilimitada. Por exemplo

  • O AWS Parallel Computing Service oferece um serviço totalmente gerenciado que você pode usar para criar ambientes completos e elásticos que podem hospedar suas workloads de computação de alta performance.
  • O AWS ParallelCluster é uma ferramenta completa de gerenciamento de clusters de código aberto que simplifica o gerenciamento de clusters de HPC na AWS.
  • O Amazon Elastic Fabric Adapter ajuda os usuários a executar aplicações de HPC e ML na escala de que precisam, oferecendo a capacidade de escalar para milhares de GPUs ou CPUs.
  • O Amazon DCV é um protocolo de exibição remota que ajuda os clientes a acessar uma forma segura de fornecer desktops remotos e streaming de aplicações em várias condições de rede.

Comece a usar a computação de alta performance na AWS criando uma conta gratuita hoje mesmo.