Testimonianze dei clienti/Software e Internet

2022
logo di salesforce

La UIP di Salesforce utilizza le istanze spot di Amazon EC2 per ridurre i tempi di elaborazione dei dati di oltre il 90% e risparmiare oltre 1 milione di dollari al mese

1 milione di dollari

risparmiati al mese

200-250 TB

elaborati al costo richiesto in precedenza per 100 TB 

Da 4 ore a 15 minuti

riduzione dei tempi di elaborazione

Test di configurazione

esplorati e testati in poche ore

Panoramica

Il team della Unified Intelligence Platform (UIP) di Salesforce gestisce un data lake a livello di petabyte e stava progettando di innovare l'analisi e l'elaborazione dei dati, con l'obiettivo di ridurre i costi e aumentare l'efficienza. Utilizzando Amazon Web Services (AWS) per una combinazione di modelli di provisioning di istanze da Amazon Elastic Compute Cloud (Amazon EC2), che fornisce capacità di calcolo sicura e ridimensionabile per praticamente qualsiasi carico di lavoro, il team della UIP è stato in grado di sviluppare un'infrastruttura di calcolo scalabile ed elastica. La sua infrastruttura di calcolo rimodellata richiede meno tempo per elaborare il doppio dei dati, facendo risparmiare all'azienda oltre 1 milione di dollari al mese.

Salesforce utilizza AWS per i flussi di lavoro relativi ai dati, mentre AWS utilizza Salesforce per la gestione delle relazioni con i clienti. Questa partnership semplifica agli sviluppatori l'utilizzo di entrambe le tecnologie per creare e lanciare applicazioni per i clienti, utilizzare i servizi AWS in modo nativo all'interno di Salesforce e connettere in modo sicuro dati e flussi di lavoro tra Salesforce e AWS.

Business coworkers discussing new ideas and brainstorming in a modern office

Opportunità | Progettazione per l'efficienza su AWS

Nella seconda metà del 2019, il team della UIP ha iniziato la transizione dei propri cluster on-premise verso Amazon EMR, una piattaforma cloud per i big data che esegue processi di elaborazione di dati distribuiti su vasta scala, query SQL interattive e applicazioni di machine learning utilizzando framework open source di analisi dei dati come Apache Spark, Apache Hive e Trino. L'utilizzo di Amazon EMR aiuta Salesforce a ridurre la complessità della gestione dei suoi framework per i big data e fornisce un'integrazione nativa per le istanze spot di Amazon EC2, che aiutano le aziende a sfruttare la capacità inutilizzata di Amazon EC2 nel cloud.

Il team ha identificato i carichi di lavoro in esecuzione su Apache Spark come ottimi candidati per l'utilizzo di istanze spot come parte di una strategia di ottimizzazione dei costi. Apache Spark su Amazon EMR offre nuovi tentativi automatici, che contribuiscono a fornire resilienza in caso di recupero delle istanze spot a causa dei requisiti di capacità di Amazon EC2. Inoltre, il team della UIP utilizza Spark Streaming per elaborare i dati in finestre di 5 minuti, un altro fattore che aiuta a ridurre al minimo la possibilità di dover ripetere i tentativi.

Per trovare la massima disponibilità al prezzo più basso, la UIP di Salesforce ha sperimentato l'utilizzo di istanze spot insieme ad altre opzioni di acquisto di Amazon EC2. La UIP ha eseguito scenari su diverse percentuali di istanze spot e istanze on demand di Amazon EC2, per le quali le aziende pagano la capacità di elaborazione al secondo senza alcun impegno a lungo termine e hanno il pieno controllo sul ciclo di vita dell'istanza. Grazie alle istanze on demand, la UIP di Salesforce utilizzava Savings Plans, un modello flessibile di determinazione dei prezzi che offre prezzi inferiori rispetto all'offerta on demand, in cambio di un preciso impegno nell'utilizzo. Cercando di bilanciare l'affidabilità del cluster con gli sconti sulle istanze, il team della UIP ha identificato una configurazione ottimale in cui il 60% dell'utilizzo di Amazon EC2 traeva vantaggio dalle istanze spot e il resto dalla copertura di Savings Plans. Per soddisfare gli accordi sul livello di servizio (SLA), la UIP di Salesforce ha creato i propri parchi istanze pensando alle prestazioni. Suddivide i carichi di lavoro in cluster SLA e non SLA a seconda delle caratteristiche del processore e della capacità di soddisfare i requisiti temporali degli accordi sul livello di servizio. "In termini di creazione del nostro parco istanze, penso che il vero vantaggio sia il numero di tipi di istanze che è possibile utilizzare", afferma Eric Legault, Principal Engineer presso Salesforce. "L'utilizzo di AWS ci ha aiutato sperimentare con diverse configurazioni di macchine e a provare diversi scenari. Bastava solo modificare la configurazione e in un paio d'ore potevamo osservare se funzionava o meno. Quindi penso che sia stato un elemento fondamentale per il successo di questo progetto".

kr_quotemark

Il dimensionamento gestito di Amazon EMR gioca un ruolo importante nella nostra possibilità di utilizzare la capacità elastica del cloud. E riduciamo significativamente i costi utilizzando semplicemente le istanze spot in modo innovativo".

Eric Legault
Principal Engineer, Salesforce

Soluzione | Risparmio di milioni utilizzando le istanze Spot

In linea con le best practice di AWS per l'utilizzo delle istanze spot, il team ha aggiunto ulteriore stabilità al proprio parco istanze passando da due o tre tipi di istanze a 27 tipi di istanze mantenendo la stessa capacità. Il team della UIP gestisce 12 cluster specializzati per scopi diversi, utilizzando tipi di istanze ottimizzati per CPU, memoria o carichi di lavoro bilanciati e dotati di una combinazione di processori Intel e AMD. "Più tipi di istanze ci sono, più resiliente è il cluster", afferma Legault.

La UIP di Salesforce ora elabora 200-250 TB al giorno e scrive quasi il doppio della quantità di dati per circa lo stesso costo precedentemente richiesto per elaborare 100 TB. Riprogettando l'elaborazione dell'importazione in un approccio streaming e utilizzando le istanze spot per aumentare l'infrastruttura controllando al contempo i costi, il team ha anche migliorato l'efficienza di elaborazione, riducendo i tempi di importazione ed elaborazione dei dati da 4 ore a 15 minuti. Per fornire una maggiore visibilità delle sue metriche di calcolo, Salesforce utilizza Amazon CloudWatch, un servizio di monitoraggio e osservabilità delle risorse AWS. Il team monitora le applicazioni tramite pannelli di controllo personalizzati creati utilizzando il software open source Grafana, che fornisce la visualizzazione delle metriche operative.

La soluzione della UIP di Salesforce utilizza anche il dimensionamento gestito di Amazon EMR, che ridimensiona automaticamente il cluster per ottenere le migliori prestazioni al minor costo possibile. Per compensare la possibilità di recuperare un'istanza spot, Salesforce consente al cluster di ridimensionarsi di circa il 5% rispetto alla capacità. La capacità aggiuntiva comporta un'elaborazione più rapida per fornire maggiore disponibilità e stabilità nel cluster quando necessario. "Penso che questo sia il vero vantaggio: possiamo aumentare la capacità e ridurla quando non è necessaria", afferma Legault. "Questo processo si occupa anche di tutto ciò che è andato storto in termini di recupero". Inoltre, l'utilizzo di una nuova funzionalità all'interno del dimensionamento gestito di Amazon EMR impedisce alla UIP di Salesforce di ridurre le istanze che memorizzano dati shuffle intermedi per Apache Spark, il che consente prestazioni migliori e costi inferiori.

L'aggiunta delle istanze spot da parte della UIP di Salesforce integra l'utilizzo di Savings Plans e riduce i costi di elaborazione di oltre il 60 percento, facendo risparmiare all'azienda oltre 1 milione di dollari al mese. Oltre a due cluster che funzionano a tempo pieno, il team della UIP può aumentare in modo conveniente un terzo cluster quando necessario per far fronte a un afflusso improvviso di dati. L'utilizzo delle istanze spot da parte del team della UIP per gestire l'aumento della capacità aiuta anche a ridurre i costi in altre aree di Salesforce, liberando istanze di Savings Plans che altri team possono utilizzare per ridurre i costi durante i periodi di picco.

Risultato | Integrazione dell'intelligenza nella gestione del parco istanze

Come parte del processo di ottimizzazione, il team della UIP utilizza il consulente istanze spot, che aiuta le aziende a determinare i pool con le minori possibilità di interruzione e garantisce un risparmio rispetto alle tariffe on demand. Il team spera di sfruttare ancora più intelligenza nella gestione dinamica del parco istanze utilizzando il punteggio di posizionamento spot di Amazon EC2, che può consigliare, in tempo quasi reale, una Regione o una zona di disponibilità AWS in base ai requisiti di Salesforce. Utilizzando il punteggio di posizionamento spot di Amazon EC2, il team della UIP prevede di trovare una capacità ancora maggiore e prezzi inferiori con l'espansione nelle Regioni AWS. "Utilizziamo la capacità del cloud e l'ampia gamma di tipi di istanze Amazon EC2 per fare cose che sarebbero impossibili on-premise", afferma Legault. "Il dimensionamento gestito di Amazon EMR gioca un ruolo importante nella possibilità di utilizzare la capacità elastica del cloud. E riduciamo significativamente i costi utilizzando semplicemente le istanze spot in modo innovativo".

Informazioni su Salesforce

In qualità di principale piattaforma per la gestione delle relazioni con i clienti (CRM) e il coinvolgimento dei clienti, Salesforce assiste più di 150.000 aziende in tutto il mondo. Salesforce unisce i team di vendita, assistenza, marketing, quelli commerciali e IT con un'unica visione condivisa delle informazioni sui clienti, contribuendo a far crescere le relazioni con clienti e dipendenti.

Servizi AWS utilizzati

Amazon Elastic Compute Cloud (EC2)

Amazon EC2 offre la piattaforma di calcolo più ampia e approfondita, con oltre 500 istanze e la selezione di processori, sistemi di archiviazione, reti, sistemi operativi e modelli di acquisto più recenti per aiutarti a soddisfare al meglio le esigenze del tuo carico di lavoro.

Ulteriori informazioni »

Istanze Spot di Amazon EC2

Le istanze spot di Amazon EC2 ti consentono di sfruttare la capacità EC2 inutilizzata all'interno del cloud AWS.

Ulteriori informazioni »

Savings Plans

Savings Plans è un modello flessibile di determinazione dei prezzi che offre prezzi inferiori rispetto all'offerta on demand, in cambio di un preciso impegno nell'utilizzo (misurato in dollari/ore) per un periodo annuale o triennale.

Ulteriori informazioni »

Dimensionamento gestito di Amazon EMR

Con il dimensionamento gestito di EMR puoi specificare i limiti di calcolo minimi e massimi per i cluster e Amazon EMR li ridimensiona automaticamente in modo da ottenere prestazioni e utilizzo delle risorse migliori.

Ulteriori informazioni »

Inizia

Organizzazioni di tutte le dimensioni in tutti i settori trasformano il proprio business e realizzano le loro missioni ogni giorno utilizzando AWS. Contatta i nostri esperti e inizia subito il tuo percorso verso il cloud AWS.