Was ist eine Datenbank?

Eine Datenbank ist eine elektronisch gespeicherte, systematische Sammlung von Daten. Es kann jede Art von Daten enthalten, einschließlich Wörter, Zahlen, Bilder, Videos und Dateien. Zum Speichern, Abrufen und Bearbeiten von Daten können Sie eine Software verwenden, die als Datenbankmanagementsystem (DBMS) bezeichnet wird. In Computersystemen kann sich das Wort Datenbank auch auf ein beliebiges DBMS, auf das Datenbanksystem oder auf eine der Datenbank zugeordnete Anwendung beziehen.

Warum ist eine Datenbank wichtig?

Eine leistungsstarke Datenbank ist für jedes Unternehmen von entscheidender Bedeutung. Datenbanken unterstützen den internen Betrieb von Unternehmen und speichern Interaktionen mit Kunden und Lieferanten. Sie enthalten auch Verwaltungsinformationen und spezialisiertere Daten wie technische oder wirtschaftliche Modelle. Beispiele hierfür sind digitale Bibliothekssysteme, Reisebuchungssysteme und Inventarsysteme. Im Folgenden sind einige Gründe aufgeführt, warum Datenbanken unerlässlich sind.

Effiziente Skalierung

Datenbankanwendungen können große Datenmengen verwalten und auf Millionen, Milliarden und mehr skalieren. Es ist unmöglich, diese Menge digitaler Daten ohne Datenbank zu speichern.

Datenintegrität

Datenbanken verfügen häufig über integrierte Regeln und Bedingungen, um die Datenkonsistenz aufrechtzuerhalten.

Datensicherheit

Datenbanken unterstützen Datenschutz- und Compliance-Anforderungen in Bezug auf Daten. Um beispielsweise Zugriff auf die Datenbank zu erhalten, müssen sich Benutzer anmelden. Verschiedene Benutzer können auch unterschiedliche Zugriffsebenen haben, z. B. schreibgeschützt.

Datenanalyse

Moderne Softwaresysteme nutzen Datenbanken zur Datenanalyse. Diese Systeme können Trends und Muster erkennen oder Vorhersagen treffen. Datenanalysen helfen einem Unternehmen, Geschäftsentscheidungen mit Zuversicht zu treffen.

Welche Arten von Datenbanken gibt es?

Sie können Datenbanken nach Anwendungsfall, Datentyp und Datenspeichermethode klassifizieren. Hier sind drei Beispiele für die Klassifizierung von Datenbanken:

  • Anhand ihres Inhalts, wie Dokumenttext, Statistik oder Multimediaobjekte
  • Nach ihrem Anwendungsgebiet, wie Buchhaltung, Film oder Fertigung
  • Aufgrund ihrer technischen Aspekte, wie der Datenbankstruktur oder des Schnittstellentyps

Was ist eine Datenbank?

Ein Datenbankmodell zeigt die logische Struktur einer Datenbank. Es definiert die Beziehungen und Regeln, die bestimmen, wie Daten gespeichert, organisiert und bearbeitet werden können. Jede Datenbankanwendung basiert auf einem bestimmten Datenmodell. Einzelne Datenbankmodelle basieren auf den Regeln und Konzepten des umfassenderen Datenmodells, das die zugrunde liegende Anwendung verwendet.

Wie haben sich Datenbanken entwickelt?

Die frühesten Datenbanken waren Magnetbänder mit sequentiell gespeicherten Datensätzen. Datenbanken entwickelten sich mit technologischen Fortschritten weiter. Sie sind inzwischen zu komplexen, leistungsstarken Systemen mit einem eigenen Studienfach geworden. Sehen wir uns an, wie sich Datenmodelle entwickelt haben. 

Hierarchische Datenbank

Hierarchische Datenbanken wurden in den 1970er Jahren populär. Anstatt Datensätze sequentiell zu speichern, hielten sie sie in einer Baumstruktur, wodurch eine über- und untergeordnete Beziehung zwischen zwei Dateien hergestellt wurde. Um beispielsweise ein Datenbanksystem für ein Möbeleinzelhandelsgeschäft zu erstellen, können Sie Schlafzimmer als übergeordneten Datensatz mit Bett, Nachttisch und Kleiderschrank als untergeordnete Datensätze definieren. Der Bett-Datensatz könnte außerdem weitere untergeordnete Elemente wie Einzelbett, Doppelbett, Queensize-Bett usw. enthalten. Leider war die Implementierung des hierarchischen Datenmodells komplex und konnte ohne signifikante Datenduplikation nicht mit mehreren über- und untergeordneten Beziehungen umgehen.

Netzwerkdatenbank

Eine andere frühe Datenbank, das Netzwerkdatenmodell, ermöglichte es einem untergeordneten Datensatz, mehrere übergeordnete Datensätze zu haben und umgekehrt. Wenn Sie also im Beispiel eines Möbelhauses zwei übergeordnete Datensätze hatten, Schlafzimmer und Kinderzimmer, könnten beide mit dem untergeordneten Datensatz Garderobe verknüpft werden.

Relationale Datenbank

In den 1980er Jahren entwickelte sich die relationale Datenbank aufgrund ihrer Produktivität, Flexibilität und Kompatibilität mit schnellerer Hardware zu einem beliebten Unternehmensmodell. Relationale Datenbanken organisierten Datensätze als mehrere Tabellen anstelle von verknüpften Listen. 

In einem relationalen Datenbankmodell hat jede Kategorie eine Tabelle mit Kategorieattributen als Spalten und Datensätzen als Zeilen. Beispielsweise können Sie das Möbelgeschäft als eine Reihe von Tabellen modellieren – Räume und Möbel. Die Tabellen sind durch die Spalten Raumnummer und Möbelname verknüpft. Beide Spalten werden auch Primärschlüssel genannt.

Raumnummer

Raumname

1

Schlafzimmer

2

Kinderzimmer

 

Name der Möbel

Farbe

Bett

Braun

Garderobe

Weiß

Nachttisch

Schwarz

 

Raumnummer

Name der Möbel

1

Bett

1

Garderobe

2

Garderobe

 

Objektorientierte Datenbank

Objektorientierte Datenbanken entwickelten sich in den 1990er Jahren als Reaktion auf das Aufkommen der objektorientierten Programmierung. Programmierer und Designer begannen, die Daten in ihren Datenbanken als Objekte zu behandeln. Beispielsweise können Sie die Attribute eines Stuhls, wie Farbe und Größe, einem Stuhl-Datenobjekt zuordnen. Dieses Objekt ist eine virtuelle Darstellung des realen Stuhls in der objektorientierten Datenbank.

NoSQL-Datenbank

SQL ist eine Abfragesprache, die zum Abrufen, Zugreifen und Bearbeiten von Daten in relationalen Datenbanken verwendet wird. NoSQL stellt das Gegenteil dar, einen Datenbankmechanismus, der bei der Datenmodellierung keine tabellarischen Beziehungen verwendet. NoSQL-Datenbanken wurden zu Beginn des einundzwanzigsten Jahrhunderts erstellt, als Cluster-Datenverarbeitung und verteilte Datenbankarchitekturen entstanden. Verteilte Architekturen speichern eine große Datenbank über mehrere zugrunde liegende Speichergeräte. Diese Anordnung wird als horizontale Skalierung bezeichnet. Die in NoSQL verwendeten Softwaremechanismen sind hohe Geschwindigkeit, keine Notwendigkeit für feste Tabellenschemata, die Fähigkeit, doppelte oder gruppierte Daten zu speichern, und die Fähigkeit, horizontal zu skalieren.

Was sind moderne Datenbanken?

Die heute verwendeten Datenbanken haben sich weiterentwickelt, um sowohl vertikal als auch horizontal zu skalieren. Sie können riesige Daten in der Cloud speichern und erweiterte Softwareschnittstellen für Machine Learning und andere Datenanalysen bereitstellen.

Cloud-Datenbank

Eine Cloud-Datenbank läuft normalerweise auf einer Cloud-Datenverarbeitungsplattform. Es gibt zwei Standardbereitstellungsmodelle: Benutzer können Datenbanken unabhängig in der Cloud ausführen oder Zugriff von einem Cloud-Datenbankanbieter erwerben. Cloud-Datenbanken können sowohl SQL- als auch NoSQL-Datenmodellen folgen.

Graphdatenbank

Graphdatenbanken sind nützlich, da sie die Beziehungen zwischen verschiedenen Datensätzen priorisieren. Sie sind speziell zum Speichern und Navigieren von Beziehungen konzipiert. Eine Graphdatenbank besteht aus Knoten und Edges. Knoten speichern Datenobjekte, und Edges speichern Beziehungen zwischen Objekten. Ein Edge hat immer einen Startknoten, einen Endknoten, einen Typ und eine Richtung. Er kann Beziehungen zwischen über- und untergeordneten Elementen, Handlungen und Eigentümerschaft beschreiben. Die Anzahl und Art der Beziehungen in einem Knoten ist nicht beschränkt.

In-Memory-Datenbank

Während die meisten Datenbanken auf externen Speichergeräten gespeichert sind, befindet sich eine In-Memory-Datenbank im internen Speicher eines Computers. Sie wird jedoch in der Regel auch durch Computerdatenspeicher gesichert. In-Memory-Datenbanken sind schneller als Festplattendatenbanken. Sie werden häufig dort eingesetzt, wo die Reaktionszeit von entscheidender Bedeutung ist, z. B. in Telekommunikationsnetzwerken.

Was ist ein Datenspeicher?

Datenspeicher ist ein weit gefasster Begriff für das sehr große Datenrepository eines Unternehmens. Unternehmen produzieren alle Arten von Daten, einschließlich Dateien, Dokumente, Videos, Kundendaten, Anwendungsdaten und Systemdaten. Sie verwenden einen Datenspeicher, um alle ihre Daten zu verarbeiten und zu speichern und ihn für Analysen, Anwendungen und datengesteuerte Entscheidungen zu verwenden.

Amazon Redshift ist ein vollständig verwalteter Petabyte-Data-Warehouse-Service in der Cloud. Sie können mit ein paar hundert Gigabyte Daten beginnen und bis zu einem Petabyte oder mehr skalieren.

Wofür werden Datenbanken verwendet?

Alle Branchen verwenden Datenbanken für eine Vielzahl von Anwendungsfällen. Im Folgenden sind einige Beispiele aufgeführt:

Betrugserkennung

Graphdatenbanken helfen beim Identitätsmanagement und bei der Betrugserkennung. Algorithmen für Machine Learning finden Muster und erkennen betrügerische Aktivitäten automatisch und präventiv.

Dokumentenverwaltung

NoSQL-Datenbanken speichern und verwalten Dokumente wie Artikel und Verträge. Sie ermöglichen es Unternehmen auch, Dokumente abzufragen und zu indizieren.

Spiele und Unterhaltung

Viele Spiele- und Unterhaltungsunternehmen nutzen Datenbanken in großem Umfang, um reichhaltige Medienerlebnisse zu bieten, z. B. den gleichzeitigen Anmeldezugriff für Millionen von Benutzern.

Wie können AWS-Cloud-Datenbanken helfen?

AWS Cloud Databases bietet eine breite Auswahl an speziell entwickelten Datenbanken für jedes Unternehmen. AWS-Datenbanken unterstützen alle Aufgaben der Datenbankverwaltung, wie Serverbereitstellung, Patches, Konfiguration und Sicherungen. Dadurch können Sie sich auf die Anwendungsentwicklung konzentrieren, während AWS Ihre Datenbanken kontinuierlich überwacht und die Skalierung automatisiert. Im Folgenden finden Sie einige Beispiele für AWS-Datenbankservices:

  • Amazon Relational Database Service (Amazon RDS) ist ein verwalteter Service zum einfachen Einrichten, Betreiben und Skalieren einer relationalen Datenbank in der Cloud.
  • Amazon Aurora ist eine für die Cloud entwickelte relationale Datenbank. Als ein vollständig verwalteter Service automatisiert sie die zeitaufwändigen Aufgaben wie Bereitstellung, Patching, Backup, Fehlererkennung und mehr.
  • Amazon Neptune ist eine graph-orientierte Datenbank, die mehr als 100 000 Abfragen pro Sekunde ausführen kann.
  • Amazon Redshift ist ein vollständig verwalteter Petabyte-Data-Warehouse-Service in der Cloud.
  • Amazon ElastiCache ist eine In-Memory-NoSQL-Datenbank, die vollständig verwaltet, skalierbar und sicher ist. Sie ist eine beliebte Wahl für mobile Apps, Spiele, E-Commerce und andere Anwendungen, bei denen häufig aufgerufene Daten im Speicher gespeichert werden müssen.

Lesen Sie, wie Sie eine Datenbank auswählen, oder erstellen Sie noch heute ein kostenloses AWS-Konto für den Einstieg. 

Nächste Schritte auf AWS

Zusätzliche produktbezogene Ressourcen ansehen
Weitere Informationen zu Datenbankservices 
Ein kostenloses Konto erstellen

Sie erhalten sofort Zugriff auf das kostenlose Kontingent von AWS.

Registrieren 
Mit der Entwicklung in der Konsole starten

Starten Sie mit der Entwicklung in der AWS-Managementkonsole.

Anmelden