Cos'è un datastore?
Un datastore è un repository digitale che memorizza e protegge le informazioni nei sistemi informatici. Un datastore può essere uno storage connesso alla rete, uno storage cloud distribuito, un disco rigido fisico o uno storage virtuale. Può memorizzare sia dati strutturati, come tabelle di informazioni, sia dati non strutturati, come e-mail, immagini e video. Le organizzazioni utilizzano i datastore per mantenere, condividere e gestire le informazioni tra le varie unità aziendali.
Perché un datastore è importante?
Puoi utilizzare un datastore per salvare in modo affidabile le informazioni nei sistemi informatici e prevenire la perdita di dati. I sistemi informatici archiviano le informazioni su dispositivi di archiviazione persistente. L'archiviazione persistente è non volatile, il che significa che l'archiviazione mantiene i dati anche dopo lo spegnimento di un dispositivo. Ciò garantisce che il sistema informatico abbia accesso agli stessi dati dopo la riaccensione.
Le aziende usano i datastore per gestire, categorizzare e semplificare i dati per le operazioni, le analisi, la creazione di report e la conservazione dei dati, che è importante per la conformità normativa. I datastore hanno diversi casi d'uso, come i dati creati e consumati dalle applicazioni, dall'archiviazione dei dati, dall'analisi dei dati e dal ripristino di emergenza.
A causa delle complessità nei requisiti dei dati, le azienda usano diversi tipi di infrastrutture di archiviazione di dati per offrire accessibilità, ridondanza, governance e trasparenza. Ad esempio, le organizzazioni usano Amazon Elastic File System (Amazon EFS) per un file system serverless e Amazon Simple Storage Service (Amazon S3) per l'archiviazione di oggetti.
Quali sono alcuni termini correlati ai datastore?
Nel contesto dell'archiviazione di dati, diversi termini sono spesso utilizzati in modo intercambiabile, ma hanno significati leggermente diversi. Di seguito riportiamo alcuni esempi.
Database
Un database è un sistema di archiviazione organizzato. La maggior parte dei database si basa sull'architettura dei database relazionali. Il sistema di gestione dei database relazionali (RDBMS) consente agli utenti di memorizzare i dati in tabelle associate a punti di dati specifici. Le organizzazioni utilizzano i database per memorizzare i dati transazionali, come i log contabili, di vendita e amministrativi.
Ulteriori informazioni sui database relazionali »
Confronto tra datastore e database
Le discussioni sui datastore riguardano diversi metodi per memorizzare e recuperare le informazioni. Un database è un metodo che consente alle applicazioni di memorizzare, condividere e recuperare facilmente i dati. A differenza dei file system, un database aderisce a regole specifiche per l'organizzazione, la formattazione e l'archiviazione dei dati nel database.
Data warehouse
Un data warehouse è un'ampia raccolta di informazioni aziendali acquisite da varie origini. Le aziende utilizzano i data warehouse per supportare la business intelligence e l'analisi. Gli analisti aziendali e i data scientist traggono informazioni utili da un data warehouse.
Ulteriori informazioni sui data warehouse »
Confronto tra datastore e data warehouse
Datastore è un termine generico che comprende i diversi hardware, tecnologie, formati e architetture per l'archiviazione e il recupero delle informazioni. Un data warehouse è un tipo specifico di archivio di dati per consolidare i dati analitici delle aziende. Ad esempio, GE Renewable Energy utilizza AWS Redshift per ottenere nuove informazioni sui dati raccolti.
Come funziona un datastore?
Un dispositivo di archiviazione di dati fisico è la tecnologia alla base di un datastore. Puoi leggere e scrivere informazioni sul dispositivo in formati specifici come file, tabelle o blocchi. Il dispositivo può essere locale, remoto o nel cloud. I grandi datastore sono tipicamente distribuiti tra più dispositivi fisici in diverse posizioni geografiche. I sistemi e i servizi software astraggono le operazioni alla base dei datastore.
Di seguito sono illustrati alcuni esempi di dispositivi fisici. Diversi tipi di dispositivi di archiviazione di dati offrono gradi variabili di sicurezza e ridondanza.
Unità Flash e SSD
Un'unità allo stato solido (SSD) è una tecnologia a semiconduttori che consente la scrittura e la lettura di dati in chip di memoria flash. La tecnologia di archiviazione flash era disponibile in commercio nelle pen drive prima di diventare un'alternativa ai dischi rigidi (HDD). Rispetto a un HDD, un SSD fisico non ha parti mobili, il che significa che le prestazioni sono più veloci e la durata di vita più lunga.
Array di archiviazione ibrido
L'array di archiviazione ibrido è una configurazione fisica di archiviazione composta da un'unità SSD e un'unità HDD. Sebbene un'unità SSD offra un funzionamento a bassa latenza, il loro costo per unità di archiviazione è molto più elevato rispetto alle unità HDD. Pertanto, le organizzazioni utilizzano un array di archiviazione ibrido per bilanciare prestazioni, capacità e costi.
RAID
RAID è un acronimo che sta per Redundant Array of Independent Disks, ovvero un array ridondante di dischi indipendenti. È una tecnologia che mantiene gli stessi dati in più punti di un'unità SSD.
Quali sono i diversi formati di datastore?
I datastore sono progettati per elaborare e organizzare i dati in diversi formati.
Archiviazione di file
L'archiviazione di file organizza le informazioni archiviate in una gerarchia di file e cartelle in una gerarchia dall'alto verso il basso di file e cartelle. I computer usano l'archiviazione di file per facilitare l'archiviazione, la ricerca e il recupero di informazioni agli utenti. Puoi usare il sistema di archiviazione di file per archiviare e organizzare quasi qualsiasi tipo di dati. Sebbene l'archiviazione di file sia semplice da usare, è difficile da dimensionare orizzontalmente a causa della sua architettura strettamente connessa.
Ulteriori informazioni sull'archiviazione dei file »
Archiviazione a blocchi
L'archiviazione a blocchi divide i dati in più parti di segmenti di dimensioni uniformi, chiamati blocchi. Il sistema di archiviazione a blocchi memorizza blocchi di dati diversi su dispositivi fisici diversi. Recupera e ricompone i pezzi quando gli utenti richiedono dati specifici. Utilizza un sistema di mappatura per individuare i dati richiesti in base ai metadati del blocco. I metadati sono informazioni aggiuntive che aiutano gli utenti o le applicazioni a trovare informazioni specifiche nell'archivio.
Ulteriori informazioni sull'archiviazione a blocchi »
Archiviazione di oggetti
L'archiviazione di oggetti memorizza i dati non strutturati in un repository scalabile e autonomo che può essere ospitato su diversi server. Ogni blocco di dati che appartiene a un oggetto è descritto nei suoi metadati. Ad esempio, un oggetto può memorizzare contenuti dei social media, video, e-mail e file audio. Le applicazioni cercano le informazioni nell'archivio degli oggetti utilizzando attributi di metadati specifici, come la risoluzione del video, la durata e la posizione.
Quali sono i diversi tipi di datastore?
Esistono diversi tipi di datastore, ciascuno con la sua configurazione e caratteristiche uniche.
Direct-attached storage
Per direct-attached storage (DAS) si intendono dispositivi di archiviazione che si connettono fisicamente a un computer. Ad esempio, una configurazione DAS collega un disco rigido, un disco ottico o un'unità flash a un computer. Creare copie di backup su DAS è abbastanza semplice, ma la condivisione dei dati con altri computer è difficile.
Network-attached storage
Il network-attached storage (NAS) è un dispositivo di archiviazione dedicato ai file che rende i dati sempre disponibili ad applicazioni e utenti per collaborare in maniera efficace in una rete. I dispositivi NAS sono server specializzati che si occupano esclusivamente dell'archiviazione di dati e delle richieste di condivisione file. Forniscono servizi di archiviazione veloci, sicuri e affidabili a reti private.
Ulteriori informazioni sul NAS »
Storage area network
Una storage area network (SAN) è un'infrastruttura di archiviazione di dati ad alta velocità che usa diversi tipi di mezzi e protocolli di archiviazione. Le aziende utilizzano la rete SAN per dimensionare l'archiviazione a blocchi in modo facile e conveniente. La rete SAN usa la virtualizzazione dell'archiviazione per nascondere la complessità dell'infrastruttura da molti dispositivi.
Archiviazione nel cloud
L'archiviazione nel cloud è un'infrastruttura di archiviazione distribuita ospitata e gestita da fornitori di cloud. È più scalabile, flessibile e accessibile da remoto rispetto all'archiviazione on-premise. Ad esempio, gli utenti possono connettersi ai servizi di archiviazione cloud AWS purché abbiano una connessione a Internet e siano autorizzati ad accedere ai dati. L'archiviazione nel cloud è anche efficiente dal punto di vista dei costi, in quanto gli utenti pagano solo per la capacità utilizzata.
Archiviazione su cloud ibrido
L'archiviazione su cloud ibrido consente alle aziende di separare i dati tra servizi di archiviazione on-premise e su cloud. L'archiviazione su cloud ibrido aiuta le aziende a eseguire la migrazione da un'architettura legacy a un ambiente cloud più economico e sicuro.
In che modo AWS può contribuire ai requisiti dei datastore?
AWS offre diverse decine di servizi di archiviazione nel cloud per soddisfare le esigenze di archiviazione dei dati. Inoltre, hai la possibilità di ospitare qualsiasi cosa tu voglia sulle tue istanze Amazon Elastic Compute Cloud (Amazon EC2). Per scegliere il miglior servizio di archiviazione su cloud AWS in base alle tue esigenze, devi:
- Segmentare il tuo sistema in carichi di lavoro.
- Identificare un meccanismo di archiviazione di dati più adatto a un particolare carico di lavoro, non un singolo datastore per l'intero sistema.
- Ottimizzare ulteriormente in base a costi e prestazioni per trovare il servizio di datastore più adatto a te.
Ad esempio, Amazon Relational Database Service (Amazon RDS) è una scelta popolare per le organizzazioni che desiderano creare e dimensionare database relazionali. Fornisce alle applicazioni un datastore cloud ad alta disponibilità per l'archiviazione di dati operativi persistenti. Amazon RDS offre una soluzione di provisioning di database autogestita che libera gli sviluppatori dalla noiosa configurazione dell'infrastruttura di archiviazione.
Inizia a usare i datastore su AWS registrandoti oggi stesso per un account AWS.
Fasi successive del datastore
Ottieni accesso istantaneo al Piano gratuito di AWS.