Was ist ein Datenspeicher?
Ein Datenspeicher ist ein digitales Repository, das die Informationen in Computersystemen speichert und schützt. Ein Datenspeicher kann ein mit dem Netzwerk verbundener Speicher, ein verteilter Cloud-Speicher, eine physische Festplatte oder ein virtueller Speicher sein. Er kann sowohl strukturierte Daten wie Informationstabellen als auch unstrukturierte Daten wie E-Mails, Bilder und Videos speichern. Unternehmen verwenden Datenspeicher, um Informationen aufzubewahren, gemeinsam zu nutzen und über Geschäftseinheiten hinweg zu verwalten.
Warum ist ein Datenspeicher wichtig?
Sie können einen Datenspeicher verwenden, um Informationen in Computersystemen zuverlässig zu speichern und somit Datenverlust zu verhindern. Computersysteme speichern Informationen auf persistenten Speichergeräten. Persistenter Speicher ist nicht-flüchtig, d. h. der Speicher behält die Daten bei, sogar nachdem ein Gerät ausgeschaltet wurde. Dadurch wird sichergestellt, dass das Computersystem beim Neustart Zugriff auf die gleichen Daten hat.
Unternehmen verwenden Datenspeicher zum Verwalten, Kategorisieren und Optimieren von Daten für Vorgänge, Analysen, Berichterstattung und Datenaufbewahrung, was für die Einhaltung von Vorschriften wichtig ist. Datenspeicher haben mehrere Anwendungsfälle, wie z. B. Daten, die von Anwendungen erstellt und verbraucht werden, Datenarchivierung, Datenanalyse und Notfallwiederherstellung.
Aufgrund der Komplexität bei den Datenanforderungen verwenden Unternehmen verschiedene Arten von Datenspeicher-Infrastruktur, um Zugriff, Redundanz, Governance und Transparenz zu bieten. Zum Beispiel verwenden Unternehmen Amazon Elastic File System (Amazon EFS) für ein Serverless-Dateisystem und Amazon Simple Storage Service (Amazon S3) für Objektspeicher.
Was sind einige der Begriffe im Zusammenhang mit Datenspeicher?
Im Kontext von Datenspeichern werden einige Begriffe oft austauschbar verwendet, die jedoch leicht unterschiedliche Bedeutungen haben. Im Folgenden geben wir einige Beispiele.
Datenbank
Eine Datenbank ist ein organisiertes Speichersystem. Die meisten Datenbanken basieren auf der Architektur einer relationalen Datenbank. Das Relational Database Management System (RDBMS) ermöglicht es Benutzern, Daten in Tabellen zu speichern, die spezifischen Datenpunkten zugeordnet sind. Unternehmen verwenden Datenbanken, um Transaktionsdaten wie Buchhaltung, Verkäufe und Verwaltungs-Protokolle zu speichern.
Lesen Sie über relationale Datenbanken »
Datenspeicher im Vergleich zu Datenbanken
Bei Datenspeicher stehen verschiedene Methoden zum Speichern und Abrufen von Informationen im Gespräch. Eine Datenbank ist eine Methode, die es Anwendungen ermöglicht, Daten einfach zu speichern, freizugeben und abzurufen. Anders als bei Dateisystemen hält sich eine Datenbank an spezifische Regeln bezüglich der Weise, in der Daten in der Datenbank organisiert, formatiert und gespeichert werden.
Data Warehouse
Ein Data Warehouse ist eine umfangreiche Sammlung von geschäftlichen Informationen aus diversen Quellen. Unternehmen verwenden Data Warehouses, um Business Intelligence und Analytik zu unterstützen. Geschäftsanalysten und Datenwissenschaftler gewinnen umsetzbare Erkenntnisse aus einem Data Warehouse.
Lesen Sie über Data Warehouses »
Datenspeicher im Vergleich zu Data Warehouses
Ein Datenspeicher ist ein Überbegriff, der die verschiedenen Hardware-Komponenten, Technologien, Formate und Architekturen zum Speichern und Abrufen von Informationen umfasst. Ein Data Warehouse ist ein bestimmter Typ von Datenspeicher, mit dem Analysedaten für Unternehmen konsolidiert werden. Zum Beispiel: GE Renewable Energy verwendet AWS Redshift, um neue Erkenntnisse aus seinen gesammelten Daten zu erlangen.
Wie funktioniert ein Datenspeicher?
Ein physisches Datenspeicher-Gerät ist die zugrunde liegende Technologie eines Datenspeichers. Sie können Informationen lesen und in spezifischen Formaten wie Dateien, Tabellen oder Blocks in das Gerät schreiben. Das Gerät kann am lokalen oder an einem entfernten Standort befinden, oder in der Cloud. Große Datenspeicher sind typischerweise über mehrere physische Geräte an verschiedenen geographischen Standorten verteilt. Softwaresysteme und -Services abstrahieren die zugrunde liegenden Vorgänge des Datenspeichers.
Im Folgenden sind einige Beispiele von physischen Geräten angeführt. Verschiedene Arten von Datenspeicher-Geräten bieten einen unterschiedlichen Grad an Sicherheit und Redundanz.
Flash- und SSD-Laufwerke
Ein Solid State Drive (SSD) besteht aus einer Halbleiter-Technologie, die das Schreiben und Lesen von Daten in Flash-Speicherchips ermöglicht. Flash-Speicher-Technologie war zuerst als USB-Stick kommerziell erhältlich, bevor sie eine Alternative zu Festplatten (HDD) wurde. Im Vergleich zu einem HDD hat ein physisches SDD keine beweglichen Teile, woraus sich eine schnellere Leistung und längere Lebensdauer ergibt.
Hybridspeicher-Array
Ein Hybridspeicher-Array ist eine physische Speichervorrichtung, die aus einem SSD und einem HDD besteht. Während ein SSD mit niedriger Latenz betrieben wird, kostet es mehr pro Speichereinheit als ein HDD. Unternehmen verwenden daher ein Hybridspeicher-Array, um ein Gleichgewicht zwischen Leistung, Kapazität und Kosten zu schaffen.
RAID
RAID steht für Redundant Array of Independent Disks (redundantes Array von unabhängigen Festplatten). Es ist eine Technologie, die dieselben Daten an mehreren Orten auf einer SSD speichert.
Was sind die verschiedenen Datenspeicher-Formate?
Datenspeicher sind darauf ausgelegt, Daten in verschiedenen Formaten zu verarbeiten und zu organisieren.
Dateispeicher
Dateispeicher organisiert gespeicherte Informationen in einer absteigender Hiererchie von Dateien und Ordnern. Computer verwenden Dateispeicher, um das Speichern, Suchen und Abrufen von Informationen für Benutzer zu vereinfachen. Sie können das Dateispeichersystem verwenden, um fast jede Art von Daten zu speichern und zu organisieren. Während Dateispeicher einfach zu verwenden ist, ist die horizontale Skalierung aufgrund seiner eng verknüpften Architektur schwierig.
Lesen Sie über Dateispeicher »
Blockspeicher
Blockspeicher teilt die Daten in mehrere, gleichgroße Segmente auf, die Blocks genannt werden. Das Blockspeicher-System speichert unterschiedliche Datenblocks auf andere physische Geräte. Es wird die Teile abrufen und zusammenstellen, wenn der Benutzer spezifische Daten anfordert. Es verwendet ein Mapping-System, um die angeforderten Daten anhand von Block-Metadaten aufzufinden. Metadaten sind zusätzliche Informationen, die Benutzern oder Anwendungen dabei helfen, spezifische Informationen im Speicher zu finden.
Lesen Sie über Blockspeicher »
Objektspeicher
Objektspeicher speichert unstrukturierte Daten in einem skalierbaren, eigenständigen Repository, das auf verschiedenen Servern gehostet werden kann. Jeder Datenblock, der sich im Besitz eines Objekts befindet, wird in den Metadaten beschrieben. zum Beispiel kann ein Objekt Inhalte von sozialen Medien, Videos, E-Mails und Audiodateien speichern. Anwendungen suchen im Objektspeicher nach Informationen, indem sie spezifische Metadaten-Eigenschaften wie Videoauflösung, Dauer und Standort nutzen.
Was sind die verschiedenen Arten von Datenspeicher?
Es gibt einige verschiedene Arten von Datenspeicher mit unterschiedlichen Einrichtungen und Eigenschaften.
Direkt-angeschlossener Speicher
Direkt-angeschlossener Speicher (DAS) besteht aus Speichergeräten, die physisch mit einem Computer verbunden sind. Zum Beispiel verbindet eine DAS-Einrichtung eine Festplatte, eine optische Festplatte oder ein USB-Laufwerk mit einem Computer. Das Erstellen von Backup-Kopien ist bei einem DAS ziemlich unkompliziert, aber die Datenfreigabe an andere Computer ist schwierig.
Netzgebundener Speicher
Netzgebundener Speicher (NAS) ist ein dateispezifisches Speichergerät, das Daten für Anwendungen und Benutzer kontinuierlich verfügbar macht, damit sie effektiv über ein Netzwerk zusammenarbeiten können. NAS-Geräte sind spezialisierte Server, die ausschließlich Anforderungen zur Datenspeicherung und Dateifreigabe bearbeiten. Sie bieten schnelle, sichere und zuverlässige Speicherservices für private Netzwerke.
Storage Area Network
Storage Area Network (SAN, Speichernetzwerk) ist eine Hochgeschwindigkeits-Datenspeicher-Architektur, die verschiedene Arten von Speichermedien und -protokolle verwendet. Unternehmen verwenden SAN, um Blockspeicher einfach und kostengünstig zu skalieren. SAN verwendet die Speicher-Virtualisierung, um die Komplexität der Infrastruktur von mehrfachen Geräten zu verbergen.
Cloud-Speicher
Cloud-Speicher ist eine verteilte Speicher-Infrastruktur, die von Cloud-Anbietern gehostet und verwaltet wird. Er ist skalierbarer, flexibler und im Gegensatz zu On-Premises-Speicher auch per Fernzugriff abrufbar. Zum Beispiel können Benutzer eine Verbindung zum AWS-Cloud-Speicher herstellen, solange sie eine Internetverbindung haben und autorisiert sind, auf die Daten zuzugreifen. Cloud-Speicher ist auch kostengünstig, nachdem Benutzer nur für die Kapazität bezahlen, die sie nutzen.
Hybrid-Cloud-Speicher
Hybrid-Cloud-Speicher ermöglicht es Unternehmen, Daten zwischen On-Premises- und Cloud-Speicherservices zu trennen. Hybride-Cloud-Speicher hilft Unternehmen bei der Migration von Legacy-Architektur zu einer kostengünstigeren, sichereren Cloud-Umgebung.
Wie kann AWS bei Ihren Datenspeicher-Anforderungen helfen?
AWS bietet einige Dutzend Cloud-Speicherservices, um Ihre Datenspeicher-Anforderungen zu erfüllen. Zusätzlich haben Sie die Option, alles, was sie wollen, auf Ihren Amazon Elastic Compute Cloud (Amazon EC2)-Instances zu hosten. Um den besten AWS-Cloud-Speicherservice für Ihre Anforderungen auszuwählen, müssen Sie:
- Teilen Sie Ihr System in Workloads auf.
- Identifizieren Sie einen Datenspeicher-Mechanismus, der für eine bestimmte Workload am besten geeignet ist, anstatt einen einzelnen Datenspeicher für das gesamte System zu wählen.
- Optimieren Sie dazu auch nach Kosten und Leistung, um den Datenspeicher-Service zu ermitteln, der für Sie am besten geeignet ist.
Zum Beispiel ist Amazon Relational Database Service (Amazon RDS) eine beliebte Wahl für Unternehmen, die relationale Datenbanken einrichten und skalieren möchten. Es bietet Anwendungen mit einem hochverfügbaren Cloud-Datenspeicher zum Speichern von persistenten Betriebsdaten. Amazon RDS bietet eine selbstverwaltete Datenbank-Bereitstellungslösung, die Entwicklern das mühsame Einrichten einer Speicherinfrastruktur erspart.
Beginnen Sie mit Datenspeicher in AWS, indem Sie sich noch heute für ein AWS-Konto registrieren.
Datenspeicher nächste Schritte
Sie erhalten sofort Zugriff auf das kostenlose Kontingent von AWS.
Starten Sie mit der Entwicklung in der AWS-Managementkonsole.