Cos’è la portabilità dei dati?
Cos’è la portabilità dei dati?
La portabilità dei dati è la capacità di spostare i dati tra due sistemi a piacimento. Le aziende moderne hanno requisiti di archiviazione e accesso ai dati diversi a seconda del caso d’uso, della posizione geografica, delle normative e delle aspettative dei clienti. La portabilità dei dati consente loro di trasferire i dati secondo necessità tra fornitori di servizi cloud e sistemi on-premises, consentendo loro di soddisfare al meglio i requisiti.
Perché la portabilità dei dati è importante?
I sistemi legacy imponevano formati di dati proprietari e obblighi di licenza ai clienti, bloccandoli in sistemi specifici. Sfide tecniche complesse legate allo spostamento dei dati, aumento dei costi e vendor lock-in imposti. Senza la portabilità, i dati di un’organizzazione sono accessibili solo attraverso la piattaforma in cui sono archiviati. Un approccio così isolato può comportare dati inaccessibili e problemi di qualità.
I vantaggi della portabilità dei dati includono:
Supporto dell’accessibilità dei dati per l’analisi
La portabilità dei dati elimina i silos di dati, consentendo ai dati di spostarsi senza interruzioni da più sistemi in un unico repository centrale. Creando un’unica fonte di attendibilità, gli analisti aziendali dispongono di un sistema più accessibile da cui attingere le informazioni. Inoltre, gli analisti possono usare un set diversificato di strumenti per business intelligence (BI), machine learning (ML) e intelligenza artificiale (IA) su questo pool di dati centralizzato, sfruttandolo per fornire approfondimenti e capacità decisionali in tempo reale ad altri reparti.
Supporto della conformità normativa con il California Consumer Privacy Act e il GDPR
L’articolo 20 del Regolamento generale sulla protezione dei dati (GDPR) stabilisce che ogni individuo ha il diritto alla portabilità dei dati. Inoltre, il California Consumer Privacy Act (CCPA) richiede alle organizzazioni di implementare sistemi che consentano loro di trasferire i dati tra luoghi diversi, rimuovendo i silos di dati non necessari e promuovendo la democratizzazione dei dati.
Queste leggi sulla protezione dei dati assicurano che i soggetti titolari del trattamento implementino la portabilità dei dati, dando agli interessati e a tutte le parti coinvolte il controllo sulle loro informazioni.
Miglioramento della gestione della qualità dei dati
La portabilità dei dati implica la creazione di un sistema in cui tutti i dati possano spostarsi liberamente all’interno dell’azienda, arrivando infine all’unica fonte di attendibilità. Raccogliendo i dati in questo modo, le organizzazioni possono implementare controlli di gestione della qualità dei dati per verificare la convalida e la deduplicazione di questi ultimi e l’etichettatura dei metadati. Queste pratiche rimuovono tutti i dati duplicati, non validi o obsoleti per garantire che solo i dati completi e di alta qualità vengono consegnati al tuo sistema di archiviazione di dati centralizzato.
Come viene implementata la portabilità dei dati?
Le aziende usano diverse strategie per implementare la portabilità dei dati.
Formati di dati aperti
Esistono diversi formati di dati non proprietari che facilitano la portabilità dei dati, come JSON (JavaScript Object Notation), XML (Extensible Markup Language), Parquet e CSV (Comma Separated Values). Ognuno di questi formati è ampiamente supportato dai data warehouse e dalle piattaforme di business intelligence, il che rende la portabilità dei dati facile da integrare e utile nel consentire agli analisti di interagire con i set di dati. Fornisci sempre dati personali e trasmettili in risposta alle richieste di portabilità dei dati in questi formati aperti.
Scelta del cliente
Le aziende possono implementare la portabilità dei dati nei propri sistemi usando framework che forniscono ai clienti il pieno controllo sui dati. Ecco alcuni framework fondamentali che le aziende dovrebbero seguire:
- I clienti possiedono i propri dati, comprese tutte le informazioni provenienti dai dispositivi IoT, i dati sulla posizione, dei dispositivi indossabili e i dati generati dall’interazione con un’azienda.
- I clienti hanno la possibilità di archiviare i contenuti nel formato che preferiscono.
- I clienti scelgono le posizioni geografiche in cui archiviare i propri dati, cosa che non cambia a meno che il cliente non richieda di trasmettere i dati personali altrove.
- I clienti possono scaricare o eliminare i propri dati in qualsiasi momento.
Offrire ai clienti il pieno controllo sui propri dati consente di cambiare fornitore e rilocare i propri dati senza problemi.
Interoperabilità
L’uso di formati interoperabili, in cui i dati possono spostarsi facilmente tra più sistemi e reti senza la necessità di modifiche, migliora la portabilità dei dati. I sistemi interoperabili dovrebbero usare interfacce di programmazione delle applicazioni (API) e connessioni standardizzate per facilitare lo spostamento dei dati senza interruzioni.
Inoltre, l’implementazione di protocolli di trasferimento dati standard, come SMB (Server Message Block), NFS (Network File System), HTTPS (HyperText Transfer Protocol Secure) e SFTP (SSH File Transfer Protocol), favorisce lo spostamento senza interruzioni dei dati.
Quali sono le best practice per gestire la portabilità dei dati?
Esistono numerose strategie che le aziende possono usare per gestire la portabilità dei dati e garantire che le richieste di portabilità siano soddisfatte.
Comprendi i dati
Sviluppare una comprensione approfondita dei tipi e dei formati di dati usati dalla tua azienda, da dove provengono e dove vengono archiviati i dati e come vengono gestiti nella tua azienda promuove l’uso dei sistemi di trasferimento adatti. Con la piena visibilità su tutti i dati del tuo sistema, potrai implementare al meglio la portabilità dei dati e la sua copertura rimarrà completa.
Implementa l’automazione
L’automatizzazione dei metodi di trasferimento dei dati usati dall’azienda obbliga gli sviluppatori ad adottare formati e protocolli di dati standardizzati, facilitando questi processi automatici su diversi sistemi. Un sistema automatizzato comporta:
- una riduzione dello sforzo di portabilità dei dati;
- un miglioramento della coerenza dei dati;
- un migliore processo di migrazione dei dati tra i tuoi sistemi;
- sistemi di trasferimento dati migliorati.
Centralizza la governance dei dati
I framework di governance dei dati determinano il modo in cui l’organizzazione gestisce e usa i dati archiviati. Centralizzando la governance dei dati e stabilendo sistemi aziendali su cui fare affidamento, puoi standardizzare la policy dei dati in materia di conservazione, eliminazione, controllo e gestione degli accessi. Una governance dei dati efficace conduce a una portabilità dei dati altrettanto efficace, garantendo che questi ultimi rimangano tracciabili, mobili e conformi.
Garantisci la gestione della qualità dei dati
Analizza eventuali problemi di qualità dei dati per individuarne la causa principale. Potrebbe esserci un errore nei processi di convalida o trasformazione dei dati che causa problemi più gravi nel sistema di gestione dei dati. Risolvendo tali problemi di gestione della qualità dei dati, puoi mantenere l’integrità di questi ultimi e garantire che l’intero sistema di dati rimanga mobile senza problemi.
In che modo AWS supporta i requisiti di portabilità dei dati?
Offrire possibilità di scelta e libertà ai clienti è un principio fondamentale in AWS. I nostri clienti mantengono sempre la proprietà e il controllo dei propri dati, incluso dove sono archiviati, come vengono archiviati e chi vi ha accesso. AWS offre un’ampia gamma di tipi di database, ciascuno adatto a diversi tipi di dati. Non vi è alcun obbligo contrattuale per i clienti di rimanere con un unico tipo di database. Puoi:
- eseguire database di altri fornitori su AWS;
- cambiare il tipo di istanza su cui vengono eseguiti i tuoi database in qualsiasi momento;
- esportare i tuoi dati da AWS.
AWS offre sempre ai clienti la libertà di scegliere i servizi e le funzionalità cloud più adatti disponibili.
AWS fornisce molti strumenti e tecniche documentate per supportare la migrazione dei dati da e verso AWS. I nostri servizi sono basati su numerosi standard aperti come SQL, Linux e Xen. Ad esempio, puoi usare:
- AWS Direct Connect per connettere privatamente il tuo data center con un collegamento di rete direttamente al tuo cloud privato virtuale (VPC) in una Regione AWS;
- AWS DataSync per copiare o replicare i dati di file system in Amazon S3 o Amazon EFS;
- Gateway di archiviazione AWS: Gateway di file per collegare le applicazioni on-premises esistenti all’archiviazione nel cloud per i file archiviati come oggetti in Amazon S3;
- Gateway di archiviazione AWS: Gateway di nastri virtuali per collegare le applicazioni on-premises esistenti all’archiviazione nel cloud per i backup su nastro;
- Gateway di archiviazione AWS: Gateway di volumi per collegare le applicazioni on-premises esistenti all’archiviazione nel cloud per volumi a blocchi;
- AWS Database Migration Service per eseguire la migrazione dei database in AWS in modo rapido e sicuro con tempi di inattività minimi;
- Accelerazione del trasferimento Amazon S3 per leggere e scrivere dati su Amazon S3 su lunghe distanze geografiche;
- Amazon Data Firehose per raccogliere e inserire più origini dati in streaming.
Le API Amazon Data Portability consentono agli utenti di accedere ed esportare i propri dati personali dai servizi Amazon in un formato leggibile da una macchina. Consentono agli sviluppatori di creare strumenti che facilitano il recupero e il trasferimento sicuri dei dati degli utenti, supportando la trasparenza, il controllo degli utenti e la conformità alle normative sulla privacy dei dati.
Inizia a usare la portabilità dei dati su AWS creando un account gratuito oggi stesso.