L'architettura lakehouse di Amazon SageMaker
Semplifica l'analisi e l'IA con un'architettura dei dati unificata, aperta e sicura
Panoramica
La nuova generazione di Amazon SageMaker è basata su un'architettura lakehouse aperta, pienamente compatibile con Apache Iceberg. Unifica tutti i dati nei data lake di Amazon Simple Storage Service (Amazon S3), comprese le Tabelle S3, e nei data warehouse di Amazon Redshift, aiutando a creare potenti applicazioni di analisi, IA e machine learning (ML) su una singola copia dei dati. Accedi ed esegui query sui dati a livello locale in modo flessibile, con tutti gli strumenti e i motori compatibili con Apache Iceberg. Proteggi i dati definendo autorizzazioni granulari che vengono applicate a tutti gli strumenti e i motori di analisi e machine learning (ML). Porta i dati dai database e dalle applicazioni operative nel lakehouse in tempo quasi reale tramite integrazioni Zero-ETL. Inoltre, puoi eseguire query federate sui dati archiviati su più origini di terze parti per accedere ed eseguire query sui dati a livello locale.
Guardalo in azione
Scopri come puoi accedere ai dati unificati dai data lake S3, dalle Tabelle S3 e dai data warehouse Redshift in un data lakehouse aperto e sicuro.

Vantaggi
Unifica l'accesso a tutti i dati
Unifica tutti i dati sui data lake di Amazon S3, incluse le Tabelle S3, e sui data warehouse di Amazon Redshift. Porta i dati dai database e dalle applicazioni operative al lakehouse in tempo quasi reale tramite integrazioni Zero-ETL. Puoi utilizzare centinaia di connettori per integrare i dati provenienti da varie origini. Inoltre, puoi accedere ai dati ed eseguire query a livello locale con funzionalità di query federate su origini dati di terze parti.
Usa gli strumenti e i motori compatibili con lo standard aperto Apache Iceberg che preferisci
Ottieni la flessibilità di accedere ai dati e sottoporli a query a livello locale con tutti gli strumenti e i motori analitici compatibili con Apache Iceberg, come SQL, Apache Spark, business intelligence (BI) e strumenti di IA e ML per accedere ai dati unificati nel lakehouse.
Proteggi i dati con controlli di accesso granulari
Casi d'uso
Gestisci una singola copia di dati nei data lake e data warehouse
Unifica tutti i dati nei data lake di Amazon S3 e nei data warehouse di Amazon Redshift per le iniziative di analisi e IA con un'unica copia di dati. I controlli di accesso integrati consentono di definire autorizzazioni granulari e condividere in modo sicuro una singola copia dei dati in tutta l'organizzazione.
Esegui analisi quasi in tempo reale sui dati operativi tramite integrazioni Zero-ETL
Accedi ai dati quasi in tempo reale su database e applicazioni operative tramite integrazioni Zero-ETL. Accedi ed esegui query sui dati a livello locale, da un'ampia gamma di servizi AWS e strumenti e motori open source e di terze parti che supportano Apache Iceberg.
Crea un'architettura multi-warehouse su Amazon Redshift
Porta i dati esistenti da più data warehouse di Amazon Redshift al lakehouse per sottoporre a query e unire i dati archiviati nei cluster e nei gruppi di lavoro di Amazon Redshift. Scala i carichi di lavoro per i processi di estrazione, trasformazione e caricamento (ETL), i report di BI e l'analisi in base alle necessità senza gestire più condivisioni di dati.
Clienti
Lennar
“Negli ultimi 18 mesi abbiamo lavorato con AWS per trasformare la nostra base di dati, utilizzare le soluzioni migliori e più convenienti. Grazie a innovazioni come Amazon SageMaker Unified Studio e Amazon SageMaker Lakehouse, prevediamo di accelerare la velocità di distribuzione attraverso un accesso senza interruzioni a dati e servizi, che consentirà ai nostri ingegneri, analisti e scienziati di ricavare informazioni che forniscono valore materiale al nostro business”.
Lee Slezak, SVP of Data and Analytic presso Lennar

Roche
Roche è un'azienda pioniera a livello mondiale in campo diagnostico e farmaceutico impegnata a far progredire la scienza per migliorare la vita delle persone.
“Abbiamo utilizzato Amazon Redshift per ottenere informazioni dettagliate da dati strutturati e semi-strutturati in tutti i nostri repository di dati. Il nuovo Amazon SageMaker Lakehouse è uno strumento che mi entusiasma, perché potrebbe migliorare e unificare l'accesso al data lake e ad altre origini dati con servizi come Amazon Redshift, Catalogo dati AWS Glue e AWS Lake Formation. Questa innovazione consentirà ai nostri team di progettazione e gestione dei dati di semplificare l'accesso ai dati, promuovendo l'interoperabilità tra carichi di lavoro di dati, analisi e applicazioni. Credo che gli errori nei dati diminuiranno notevolmente grazie alla riduzione dei processi di copiatura dei dati. Prevedo inoltre una diminuzione del 40% dei tempi di elaborazione, una più rapida riscrittura dei dati di analisi nei sistemi transazionali per migliorare il processo decisionale e maggiore possibilità per i nostri team di concentrarsi sulla creazione di valore aziendale.”
Yannick Misteli, Head of Engineering, Global Product Strategy presso Roche

Idealista
Idealista supporta agenti immobiliari e privati in tutta l'Europa meridionale fornendo una piattaforma di annunci immobiliari online.
“Il nostro obiettivo è semplificare l'accesso ai dati di Salesforce per un'analisi avanzata nel nostro data lake. Sfruttando la nuova funzionalità di supporto di Amazon SageMaker Lakehouse per le integrazioni Zero-ETL dalle applicazioni, riusciamo a semplificare i nostri processi di estrazione e importazione dei dati, eliminando la necessità di più ETL per accedere direttamente a Salesforce. Questo approccio centralizzato riduce la complessità e migliora significativamente la nostra efficienza nella gestione dei dati. Prevediamo un notevole risparmio di tempo nello sviluppo dell'estrazione e dell'importazione dei dati, che consentirà al nostro team di concentrarsi sull'estrazione di informazioni utili dai nostri dati piuttosto che sulla gestione della loro raccolta.”
Javier Monterrubio, Data Platform Engineer Manager presso Idealista

Carrier
“In Carrier, la nuova generazione di Amazon SageMaker sta rivoluzionando la nostra strategia di gestione dei dati aziendali, ottimizzando il modo in cui creiamo e scaliamo i prodotti relativi ai dati. L'approccio di SageMaker Unified Studio alla scoperta, all'elaborazione e allo sviluppo di modelli di dati ha notevolmente accelerato la nostra implementazione su lakehouse. La caratteristica più notevole è che l'integrazione ottimizzata con il nostro catalogo di dati esistente e i controlli di governance integrati democratizzano l'accesso ai dati pur mantenendo elevati standard di sicurezza. Questo supporta i nostri team nell'offrire rapidamente analisi avanzate e soluzioni di IA in tutta l'organizzazione.”

Partner
Tableau
Tableau aiuta le persone e le organizzazioni a basarsi maggiormente sui dati.
“La partnership tra Amazon e Salesforce Tableau rappresenta un impegno condiviso per l'innovazione e il successo dei clienti. Attraverso la nuova integrazione Zero-ETL di Amazon, stiamo combinando dati e analisi basati sull'IA di Tableau con la potente infrastruttura di dati di Amazon per trasformare il modo in cui le organizzazioni ottengono informazioni dai propri dati. Questa perfetta integrazione consente ai nostri clienti di ottenere informazioni dettagliate da tutti i loro dati strutturati e non strutturati utilizzando la potenza di Amazon SageMaker Lakehouse e Amazon Redshift, riducendo drasticamente la complessità ingegneristica e i tempi di implementazione. Insieme, Tableau e Amazon stanno aiutando i clienti ad accelerare la trasformazione digitale e a generare valore aziendale su larga scala.”
Ali Tore, Senior VP, Advanced Analytics presso Tableau

dbt Labs
La missione di dbt Labs è aiutare gli analisti a creare e diffondere conoscenze organizzative.
“Siamo da tempo lo standard di trasformazione su Amazon Redshift e offriamo flessibilità, collaborazione e fiducia. Con il nuovo Amazon SageMaker Lakehouse, siamo entusiasti di estendere questo valore a più clienti e ancora più dati nell'ambiente AWS. Ora, i clienti possono accedere a tutti i propri dati all'interno del sistema AWS, inclusi data warehouse e data lake. Siamo felici di unire le nostre funzionalità con il nuovo Amazon SageMaker per fornire governance, catalogazione e ottimizzazioni dei dati per i nostri clienti comuni.”
Shawn Toldo, VP Partnerships presso dbt Labs

Informatica
Informatica, leader nella gestione dei dati in cloud basata sull'IA per le aziende, dà vita ai dati e all'IA consentendo alle aziende di sfruttare il potere di trasformazione delle loro risorse più importanti.
“La nostra piattaforma Intelligent Data Management Cloud (IDMC) e Amazon SageMaker aiutano le organizzazioni a sfruttare il potenziale dei dati e a promuovere l'innovazione e l'efficienza. In qualità di partner di lancio di Amazon SageMaker Lakehouse, siamo orgogliosi di offrire una soluzione di livello aziendale che soddisfa gli elevati standard delle moderne organizzazioni basate sui dati. Insieme all'infrastruttura di AWS, consentiamo di prendere decisioni più rapide e informate per risultati di impatto in tutti i settori.”
Pratik Parekh, SVP Product Management presso Informatica
