Passa al contenuto principale

Cos’è il calcolo ad alte prestazioni di AWS (HPC)?

Cos’è il calcolo ad alte prestazioni?

Il calcolo ad alte prestazioni (HPC) è una strategia di infrastruttura IT che combina gruppi di sistemi informatici per eseguire calcoli complessi e simultanei su trilioni di punti dati. Un singolo sistema informatico è limitato nella sua capacità di elaborazione dall’hardware ed è meno utile nell’esecuzione di simulazioni per campi come la modellazione climatica, la scoperta di farmaci, la ricerca genomica e altro ancora. Le tecnologie HPC possono usare più sistemi di calcolo in parallelo per aumentare la velocità di elaborazione in modo esponenziale.

Negli ultimi anni, le tecnologie HPC si sono evolute dall’esecuzione di simulazioni scientifiche ai modelli e carichi di lavoro di IA su larga scala.

Quali sono i casi d’uso dell’HPC?

Esistono diversi casi d’uso del calcolo ad alte prestazioni nel mondo accademico, industriale e aziendale.

Media e intrattenimento

I cluster ad alte prestazioni forniscono la potenza di calcolo necessaria per renderizzare video e grafica 3D, trasmettere eventi live con alta qualità video ed elaborare CGI. I cluster HPC consentono alle aziende multimediali di ridurre i tempi di produzione, accelerare la codifica video e tagliare i costi del processo di produzione.

Settore sanitario e genomica

Il settore sanitario usa l’HPC in numerosi modi, dal sequenziamento del genoma alla previsione della struttura delle proteine e persino nelle iniziative di scoperta di farmaci. I modelli basati sull’IA in esecuzione su cluster HPC aiutano ulteriormente a migliorare la ricerca e l’adozione dei farmaci.

Negli ospedali, l’elaborazione ad alte prestazioni funziona insieme al software di IA per aiutare a identificare le malattie tramite scansioni di immagini, creare piani di trattamento medico personalizzati e ottimizzare la gestione delle cartelle cliniche.

Governo e difesa

Il calcolo ad alte prestazioni è una tecnologia di supporto che fornisce risorse a diverse soluzioni di difesa, come crittografia, sorveglianza in tempo reale, analisi dell’intelligence e rilevamento delle minacce. L’accesso a un sistema di risorse dimensionabile aiuta a garantire ai governi la potenza di calcolo necessaria per portare avanti iniziative di sicurezza nazionale, simulazioni militari e altro ancora.

Modellazione climatica

La simulazione del flusso di sistemi fluidi sulla Terra, per i bollettini meteorologici e per la generazione di dati climatici, richiede l’elaborazione simultanea di enormi quantità di dati. L’HPC offre la potenza di calcolo necessaria per assimilare ed elaborare rapidamente i dati, aiutando a fornire informazioni alle agenzie che prevedono i disastri naturali, monitorano i sistemi meteorologici e prevedono i cambiamenti climatici a lungo termine.

Servizi finanziari

I servizi finanziari, come fondi speculativi, agenzie assicurative e banche, usano l’HPC per elaborare i dati necessari a eseguire modelli previsionali, prevedere il rischio di credito e ottimizzare i portafogli. La potenza di calcolo offerta dall’HPC migliora l’analisi dei dati con informazioni in tempo reale.

Settore automobilistico

Il calcolo ad alta potenza è una tecnologia fondamentale nella fluidodinamica computazionale, nei test sui materiali e di simulazione degli incidenti per l’industria automobilistica. L’HPC offre prototipazione rapida e ottimizzazioni in tempo reale dei progetti e aiuta a simulare i flussi di lavoro in fabbrica. L’HPC è anche una tecnologia centrale nelle auto a guida autonoma e nei processi decisionali basati sulla visione artificiale in tempo reale.

Sicurezza informatica

Il calcolo ad alte prestazioni consente agli amministratori di rete di analizzare il traffico per rilevare anomalie e identificare potenziali minacce prima che si verifichino. L’HPC fornisce anche risorse informatiche per la crittografia, le valutazioni a livello di sistema e la neutralizzazione delle minacce in tempo reale.

Come funziona l’HPC?

Il calcolo ad alte prestazioni aggrega la potenza di calcolo di diversi server, computer o workstation individuali per fornire una soluzione più potente. Questo processo in cui molti nodi lavorano insieme è noto come calcolo parallelo. Ogni singola macchina in questo sistema è chiamata nodo e un cluster è formato da molti nodi. Ogni nodo del sistema è responsabile della gestione di un’attività diversa e funzionano tutti in parallelo per aumentare la velocità di elaborazione.

Nodi del cluster

Le soluzioni HPC includono alcuni tipi di nodi

  • I nodi controller coordinano il lavoro nel più ampio sistema di cluster.
  • I nodi worker, o nodi di calcolo, eseguono qualsiasi elaborazione.
  • I nodi interattivi, o nodi di accesso, consentono agli utenti di connettersi al sistema HPC tramite la riga di comando o un’interfaccia grafica (GUI).

I cluster HPC possono essere eterogenei quando ogni nodo offre hardware diverso oppure omogenei quando ciascuno ha una capacità prestazionale simile.

Strutture dei cluster HPC

Esistono due principali strutture dei cluster HPC.

Cluster computing

Il cluster computing, noto anche come calcolo parallelo, è un insieme di cluster che lavorano insieme su una funzione simile e in una posizione simile. Questa struttura riduce al minimo la latenza tra i nodi grazie a una topologia di rete simile e alla vicinanza fisica.

Calcolo distribuito

Il calcolo distribuito può usare cluster che si trovano in una posizione simile o distribuiti in tutto il mondo. Questo formato di cluster può attingere dall’hardware on-premises insieme alle risorse cloud, fornendo un approccio più flessibile e dimensionabile all’HPC. 

Come funzionano i processi HPC?

I sistemi HPC eseguono due diversi tipi di processi, noti come carichi di lavoro a bassa dipendenza e strettamente interdipendenti.

Carichi di lavoro a bassa dipendenza

I carichi di lavoro a bassa dipendenza sono attività che un sistema HPC completa indipendentemente da altre funzioni che possono verificarsi in parallelo all’interno del sistema. Molte attività indipendenti vengono eseguite contemporaneamente, quindi questa forma di elaborazione HPC viene talvolta chiamata processo di carico di lavoro parallelo.

Ad esempio, durante il rendering di un video, ogni fotogramma svolge un’attività diversa. Sebbene ogni nodo che esegue il rendering di un frame può attingere dalla stessa memoria, la sua capacità di completare l’attività non dipende dal completamento dell’attività da parte di nessun altro nodo.

Carichi di lavoro strettamente interdipendenti

I carichi di lavoro strettamente interdipendenti sono attività di elaborazione HPC che dipendono l’una dall’altra per completare l’intero processo. Questi carichi di lavoro utilizzano la memoria e l’archiviazione condivisi di un cluster per distribuire le informazioni tra tutti i nodi del cluster, aiutando ciascuno a completare contemporaneamente la propria attività. I carichi di lavoro strettamente interdipendenti richiedono spesso un coordinamento in tempo reale, con molti nodi che lavorano per fornire piccole informazioni che servono a completare un’attività più ampia. Ad esempio, ogni nodo può essere responsabile della simulazione di un componente fisico distinto in una previsione meteorologica e la combinazione delle informazioni di tutti i nodi è necessaria per rendere la previsione meteorologica finale.

Cos’è l’HPC nel cloud?

Il calcolo ad alte prestazioni nel cloud consente alle aziende di sfruttare le soluzioni HPC senza gestire il cluster HPC che usano. Invece di costruire un costoso data center on-premises, l’HPC nel cloud è una soluzione conveniente che offre alle aziende la potenza di calcolo dimensionabile di cui hanno bisogno.

Tre tendenze convergenti hanno accelerato l’espansione dei servizi cloud HPC.

Rete RDMA a bassa latenza

L’uso dell’accesso diretto alla memoria remota (RDMA) ha consentito ai nodi in rete di accedere alla memoria senza richiedere l’utilizzo del loro sistema operativo. Questo approccio garantisce che un nodo possa interagire con un altro senza interrompere i suoi processi, rimuovendo i colli di bottiglia di questi ultimi, riducendo al minimo la latenza e massimizzando il throughput.

Aumento della domanda di cloud computing

Grazie all’ampia gamma di casi d’uso dell’HPC, molte aziende di vari settori ora necessitano di servizi HPC. L’HPC nel cloud consente a queste aziende di accedere ai servizi HPC senza costruire i propri data center, rendendo questa tecnologia notevolmente più accessibile.

Uso diffuso dell’IA

Un’altra causa della crescente domanda di servizi cloud HPC è l’uso diffuso di software di IA e machine learning. Gli strumenti di IA generativa richiedono una grande potenza di calcolo e l’HPC fornisce le risorse computazionali e il dimensionamento di tali sistemi. L’HPC è una soluzione efficace per le aziende che desiderano usare strumenti di IA su scala aziendale.

Quali sono i vantaggi dell’HPC nel cloud?

L’esecuzione dell’HPC nel cloud offre diversi vantaggi.

Gestione unificata e remota

Ogni progetto HPC ha requisiti di infrastruttura unici. L’acquisto autonomo limita l’organizzazione a poche configurazioni selezionate in cui può investire. Tuttavia, il cloud HPC consente alle organizzazioni di scegliere e combinare diverse configurazioni di nodi di archiviazione, calcolo, rete e accesso, GPU e workstation in base alle esigenze del progetto. Possono usare una console di gestione per interagire con tutti questi sistemi da una postazione centrale. Questo semplifica i flussi di lavoro e automatizza le funzioni del cluster per una maggiore comodità.

Provisioning e dimensionamento dinamici delle risorse

I sistemi di cloud computing ad alte prestazioni consentono alle aziende di dimensionare l’uso delle risorse di calcolo in modo dinamico, aumentandolo o diminuendolo facilmente per soddisfare la domanda. Questa flessibilità migliora l’efficienza e ottimizza l’uso delle risorse.

Aggiornamenti gestiti

I carichi di lavoro HPC gestiti tramite provider di cloud computing rilasciano automaticamente aggiornamenti per mantenere aggiornati i sistemi. Questo approccio garantisce che le soluzioni HPC siano sempre aggiornate e offrano il servizio più efficace possibile.

Flessibilità nell’uso di applicazioni personalizzate

Le aziende possono trasferire le applicazioni al proprio provider di servizi cloud. Possono personalizzare il sistema operativo e il software preinstallato per soddisfare requisiti specifici del carico di lavoro.

In che modo AWS può supportare i requisiti HPC?

I servizi completamente gestiti HPC di AWS consentono di accelerare l’innovazione con un’infrastruttura cloud HPC praticamente illimitata. Ad esempio

  • Il Servizio di calcolo parallelo AWS offre un servizio completamente gestito che puoi usare per creare ambienti completi ed elastici in grado di ospitare i tuoi carichi di lavoro di calcolo ad alte prestazioni.
  • AWS ParallelCluster è uno strumento di gestione dei cluster open source completo che semplifica la gestione dei cluster HPC su AWS.
  • Amazon Elastic Fabric Adapter aiuta gli utenti a eseguire applicazioni HPC e di machine learning (ML) sulla scala di cui hanno bisogno, offrendo la possibilità di dimensionare fino a migliaia di GPU o CPU.
  • Amazon DCV è un protocollo di visualizzazione da remoto che aiuta i clienti ad accedere a un modo sicuro per distribuire desktop remoti e streaming di applicazioni in varie condizioni di rete.

Inizia a usare il calcolo ad alte prestazioni su AWS creando un account gratuito oggi stesso.