Überspringen zum Hauptinhalt

Amazon Neptune

Hohe Leistung und Skalierbarkeit

Alles öffnen

Mit ein paar Schritten in der AWS-Managementkonsole können Sie die Rechen- und Speicherressourcen, die Ihren Produktionscluster mit Strom versorgen, hoch- oder herunterskalieren. Mit Neptune Database können Sie skalieren, indem Sie neue Replikat-Instances der gewünschten Größe erstellen oder Instances entfernen. Skalierungsvorgänge bei der Datenverarbeitung dauern in der Regel nur wenige Minuten.

Neptune Database verwendet eine verteilte und gemeinsam genutzte Speicherarchitektur, die automatisch wächst, wenn Ihr Datenspeicher wachsen muss. Neptune-Daten werden in einem Cluster-Volume gespeichert, das über eine hohe Verfügbarkeit in einer Multi-Availability Zone (Multi-AZ) verfügt. Wenn ein Neptune-DB-Cluster erstellt wird, wird ihm ein einzelnes Segment von 10 GB zugewiesen. Wenn das Datenvolumen zunimmt und den derzeit zugewiesenen Speicherplatz übersteigt, erweitert Neptune automatisch das Cluster-Volumen durch Hinzufügen neuer Segmente. Ein Neptune-Cluster-Volume kann in den unterstützten AWS-Regionen außer China und GovCloud auf eine maximale Größe von 128 TiB anwachsen. Sie müssen in Hinblick auf zukünftiges Wachstum keine Überkapazitäten für die Speicherung bereitstellen.

Mit Neptune Database können Sie den Lese-Durchsatz erhöhen, um Anwendungsanforderungen mit großem Umfang zu unterstützen, indem Sie bis zu 15 Datenbank-Lesereplikate erstellen. Neptune Replikate nutzen denselben zugrunde liegenden Speicher wie die primäre Instance. So können die Kosten gesenkt und auf das Kopieren von Daten auf die Replikatknoten verzichtet werden. Dadurch wird größere Verarbeitungsleistung für Leseanforderungen freigesetzt und die Verzögerung bei der Replizierung reduziert – häufig bis in den einstelligen Millisekundenbereich. Neptune bietet zusätzlich einen einzelnen Endpunkt für Leseabfragen, sodass die Anwendung verbunden werden kann, ohne dass die Replikate nachverfolgt werden müssen, die hinzugefügt oder entfernt werden.

Neptune ist eine zweckgerichtete, leistungsstarke Graphdatenbank-Engine. Neptune speichert und navigiert effizient durch Graph-Daten und verwendet eine speicheroptimierte Scale-Up-Architektur, um eine schnelle Abfrageevaluierung über große Graphen durchzuführen. Mit Neptune Database können Sie entweder Gremlin, openCypher oder SPARQL verwenden, um leistungsfähige Abfragen auszuführen, die leicht zu verfassen sind und eine gute Leistung zeigen. Mit Neptune Analytics können Sie OpenCypher verwenden.

Hohe Verfügbarkeit und Beständigkeit

Alles öffnen

Amazon Neptune Global Database wurde für global verteilte Anwendungen entwickelt, sodass eine einzelne Neptune-Datenbank mehrere Regionen umfassen kann. Sie repliziert die Diagrammdaten mit geringen Auswirkungen auf die Datenbankleistung, ermöglicht schnelle lokale Lesezugriffe in jeder Region mit einer niedrigen Latenzzeit und bietet eine Notfallwiederherstellung im Falle von regionalen Ausfällen.

Bei einem Ausfall der Instance automatisiert Neptune das Failover auf eine von bis zu 15 Neptune-Replikaten, die Sie in einem der drei AZs erstellt haben. Wenn keine Neptune-Replikate bereitgestellt wurden, versucht Neptune im Fehlerfall, automatisch eine neue Datenbank-Instance für Sie zu erstellen.

Der Zustand Ihrer Neptune-Datenbank und der zugrunde liegenden Amazon-EC2-Instance wird fortlaufend überwacht. Wenn die Instance, die Ihre Datenbank antreibt, ausfällt, werden die Datenbank und die dazugehörigen Prozesse automatisch neu gestartet. Bei der Wiederherstellung durch Neptune ist keine potenziell langwierige Wiedergabe der Datenbank-Wiederholungsprotokolle erforderlich, sodass die für einen Neustart benötigte Zeit normalerweise 30 Sekunden oder weniger beträgt. Amazon Aurora isoliert auch den Puffercache der Datenbank von den Datenbankprozessen, sodass der Cache auch bei einem Neustart erhalten bleibt.

Für Neptune Database wird jeder 10-GiB-Block Ihres Datenbankvolumens über drei AZs hinweg dauerhaft gemacht. Neptune Database ist fehlertolerant und verarbeitet transparent den Verlust von bis zu zwei Kopien der Daten ohne Beeinträchtigung der Schreibverfügbarkeit der Datenbank, und bis zu drei Kopien ohne Beeinträchtigung der Verfügbarkeit von Leseleistung. Der Neptune-Datenbank-Speicher verfügt außerdem über eine Funktion zur Selbstreparatur: Datenblöcke und Festplatten werden kontinuierlich auf Fehler überprüft und automatisch ersetzt.

Mit der Backup-Funktion von Neptune Database können Sie eine zeitpunktbezogene Wiederherstellung für Ihre Instance durchführen. Sie erhalten so die Möglichkeit, für jede einzelne Sekunde innerhalb des Aufbewahrungszeitraums bis zu den letzten fünf Minuten eine Wiederherstellung Ihrer Datenbank vorzunehmen. Der Aufbewahrungszeitraum für automatische Sicherungen kann auf bis zu 35 Tage konfiguriert werden. Automatisierte Backups werden in Amazon S3 gespeichert, das auf eine Haltbarkeit von 99,999999999% ausgelegt ist. Sicherungen erfolgen in Neptune automatisch, inkrementell und fortlaufend, und haben keine Auswirkung auf die Leistung der Datenbank.

Datenbank-Snapshots sind vom Benutzer gestartete, in Amazon S3 gespeicherte Backups Ihrer Instance, die dort aufbewahrt werden, bis Sie sie ausdrücklich löschen. Sie verwenden die automatisierten inkrementellen Snapshots zur Reduktion des Zeit- und Speicherbedarfs. Sie können zu jedem beliebigen Zeitpunkt eine neue Instance aus einem Datenbank-Snapshot erstellen.

Sehr sicher

Alles öffnen

Neptune Database wird in Amazon Virtual Private Cloud (Amazon VPC) ausgeführt, sodass Sie Ihre Datenbank in Ihrem eigenen virtuellen Netzwerk isolieren und mithilfe von branchenüblichen, verschlüsselten IPSec-VPNs eine Verbindung zu Ihrer lokalen IT-Infrastruktur herstellen können. Außerdem können Sie durch Verwendung der VPC-Konfiguration von Amazon Neptune die Firewall-Einstellungen festlegen und den Netzwerkzugriff auf Ihre Datenbank-Instances steuern.

Neptune ist in AWS Identity and Access Management (IAM) integriert und bietet Ihnen die Möglichkeit, die Aktionen zu steuern, die Ihre IAM-Benutzer und -Gruppen für bestimmte Neptune-Ressourcen wie Datenbank-Instances, Datenbank-Snapshots, Datenbankparametergruppen, Datenbankereignisabonnements und Datenbankoptionsgruppen ausführen können. Außerdem können Sie Ihre Neptune-Ressourcen taggen und die Aktionen kontrollieren, die Ihre IAM-Benutzer und -Gruppen mit Ressourcengruppen durchführen können, die den gleichen Tag und Tagwert haben. Beispielsweise können Sie Ihre IAM-Regeln so konfigurieren, dass sichergestellt ist, dass Entwickler „Entwicklungs“-Datenbank-Instances ändern, aber nur Datenbankadministratoren „Produktions“-Datenbank-Instances ändern und löschen können.

Neptune bietet Benutzern, die mit IAM auf die APIs der Neptune-Datenebene mit IAM zugreifen, einen präzisen Zugriff gewähren, um Graphdaten-Aktionen wie das Lesen, Schreiben und Löschen von Daten aus dem Graphen sowie andere Aktionen wie das Starten und Überwachen von Neptune-ML-Aktivitäten und das Überprüfen des Status laufender Datenebene-Aktivitäten durchzuführen. Erstellen Sie zum Beispiel eine Richtlinie mit schreibgeschütztem Zugriff für Datenanalysten, die die Daten des Graphen nicht bearbeiten müssen, eine Richtlinie mit Lese- und Schreibzugriff für Entwickler, die den Graphen für ihre Anwendungen nutzen, und eine Richtlinie für Datenwissenschaftler, die Zugriff auf Neptune-ML-Befehle benötigen.

Neptune unterstützt Verschlüsselung während der Übertragung mit TLS Version 1.2. Neptune ermöglicht es Ihnen, Ihre Datenbanken mit Schlüsseln zu verschlüsseln, die Sie über den AWS Key Management Service (AWS KMS) erstellen und kontrollieren. Bei einer mit Neptune-Verschlüsselung ausgeführten Datenbank-Instance werden ruhende Daten sowie die automatischen Backups, Snapshots und Replikate desselben Clusters auf dem zugrunde liegenden Speicher verschlüsselt.

Mit Neptune können Sie Datenbankereignisse mit minimalen Auswirkungen auf die Datenbankleistung protokollieren. Die Protokolle können später im Hinblick auf Datenbankverwaltung, Sicherheit, Governance, Einhaltung gesetzlicher Bestimmungen und sonstige Zwecke analysiert werden. Sie können Aktivitäten auch überwachen, indem Sie Auditprotokolle an Amazon CloudWatch senden.

Neptune unterstützt über 20 internationale Konformitätsstandards, von FedRAMP (Moderate und High) bis SOC (1, 2, 3), und es ist HIPAA-fähig. Die vollständige Liste der Standards, die Neptune erfüllt, finden Sie in der Liste der AWS-Services in Scope by Compliance Program.

Kostengünstig

Alles öffnen

Für Neptune gibt es keine Vorabverpflichtung. Sie zahlen eine stündliche Gebühr für jede von Ihnen gestartete Instance oder die Datenbank-Ressourcen, die Sie für den Serverless-Betrieb nutzen. Wenn Sie eine Datenbank-Instance nicht mehr benötigen, können Sie sie löschen. Sie müssen keine Überkapazitäten als Sicherheitsspielraum für die Speicherung bereitstellen, und Sie zahlen nur für die tatsächliche Speichernutzung. Weitere Informationen finden Sie auf der Neptune-Preisseite.

Vollständig verwaltet

Alles öffnen

Sie können mit Neptune beginnen, indem Sie mithilfe der AWS-Managementkonsole eine neue Neptune-Datenbank-Instance oder ein Neptune Analytics-Diagramm starten. Neptune-Datenbank-Instances sind mit einem geeigneten Satz an Parametern und Einstellungen für die gewählte Datenbank-Instance-Klasse vorkonfiguriert. Sie können eine Datenbank-Instance starten und Ihre Anwendung innerhalb von Minuten ohne weitere Konfigurationen damit verbinden. Datenbank-Parametergruppen bieten eine detaillierte Steuerung und Feinabstimmung Ihrer Datenbank.

Neptune bietet CloudWatch-Metriken für Ihre Datenbank-Instances. Mit der Konsole können Sie über 20 wichtige Betriebsmetriken für Ihre Datenbank-Instances anzeigen, darunter Rechenressourcen, Arbeitsspeicher, Speicher, Abfragedurchsatz und aktive Verbindungen.

Neptune hält Ihre Datenbank mit den neuesten Patches aktuell. Über die Versionsverwaltung der Datenbank-Engine können Sie steuern, ob und wann Ihre Instance gepatcht wird.

Neptune kann Sie per E-Mail oder SMS über Datenbankereignisse wie automatischen Failover benachrichtigen. Über die Konsole können Sie verschiedene Datenbankereignisse abonnieren, die mit Ihren Neptune-Datenbanken verknüpft sind.

Neptune unterstützt schnelle, effiziente Klonvorgänge, bei denen ganze Multi-Terabyte-Datenbank-Cluster in wenigen Minuten geklont werden können. Klonen ist für eine Vielzahl von Zwecken nützlich, einschließlich der Anwendungsentwicklung, Tests, Datenbankaktualisierungen, Datenbank-Updates und die Durchführung analytischer Abfragen. Die sofortige Verfügbarkeit von Daten kann Ihre Software-Entwicklungs- und Aktualisierungsprojekte erheblich beschleunigen und die Analysen genauer machen.

Sie können eine Neptune-Datenbank mit nur wenigen Schritten in der Konsole klonen, ohne die Produktionsumgebung zu beeinträchtigen. Der Klon wird auf drei AZs verteilt und repliziert.

Generative KI und ML

Alles öffnen

Neptune Analytics unterstützt Algorithmen zur Pfadfindung, zur Erkennung von Gemeinschaften (Clustering), zur Identifizierung wichtiger Daten (Zentralität) und zur Quantifizierung von Ähnlichkeiten. Algorithmen zur Pfadfindung ermitteln effizient die kürzeste oder optimalste Route zwischen zwei Knoten. Algorithmen zur Pfadfindung ermöglichen es Ihnen, reale Situationen wie Straßennetze oder soziale Netzwerke als miteinander verbundene Knoten und Edges zu modellieren. Das Finden der kürzesten oder optimalsten Pfade zwischen verschiedenen Punkten ist entscheidend für Anwendungen wie die Routenplanung für GPS-Systeme, die Logistikoptimierung und sogar für die Lösung komplexer Probleme in Bereichen wie Biologie oder Technik.

Algorithmen zur Erkennung von Gemeinschaften berechnen sinnvolle Gruppen oder Cluster von Knoten innerhalb eines Netzwerks und decken so verborgene Muster und Strukturen auf, die Einblicke in die Organisation und Dynamik komplexer Systeme geben können. Dies ist wertvoll in Bereichen wie der Analyse sozialer Netzwerke, der Biologie (zur Identifizierung funktioneller Module in Protein-Protein-Interaktionsnetzwerken) und sogar beim Verständnis des Informationsflusses und der Einflussausbreitung in verschiedenen Domains.

Zentralitätsalgorithmen helfen dabei, die einflussreichsten oder wichtigsten Knoten innerhalb eines Netzwerks zu identifizieren und bieten Einblicke in wichtige Akteure oder kritische Interaktionspunkte. Dies ist nützlich in Bereichen wie der Analyse sozialer Netzwerke, wo es hilft, einflussreiche Personen zu lokalisieren, oder in Verkehrsnetzen, wo es hilft, wichtige Knotenpunkte für effizientes Routing und Ressourcenzuweisung zu identifizieren.

Algorithmen zur Ähnlichkeit von Graphen ermöglichen es Ihnen, die strukturellen Ähnlichkeiten oder Unähnlichkeiten zwischen verschiedenen Graphstrukturen zu vergleichen und zu analysieren und so Einblicke in Beziehungen, Muster und Gemeinsamkeiten zwischen verschiedenen Datensätzen zu erhalten. Dies ist in verschiedenen Bereichen wie der Biologie (zum Vergleich molekularer Strukturen), sozialen Netzwerken (zur Identifizierung ähnlicher Gemeinschaften) und Empfehlungssystemen (zum Vorschlagen ähnlicher Elemente auf der Grundlage von Benutzerpräferenzen) von unschätzbarem Wert.

Neptune ML wird von SageMaker unterstützt, das GNNs verwendet, eine ML-Technik, die speziell für Grafiken entwickelt wurde, um mithilfe von Graphdaten schnelle und genauere Vorhersagen zu treffen. Mit Neptune ML können Sie die Genauigkeit der meisten Vorhersagen für Diagramme um über 50 % verbessern, verglichen mit Vorhersagen, die mit nicht-diagrammgestützten Methoden erstellt wurden.

Genaue Prognosen auf Diagrammen mit Milliarden von Beziehungen zu erstellen, kann schwierig und zeitaufwendig sein. Bestehende ML-Ansätze wie XGBoost können nicht effektiv mit Graphen arbeiten, da sie für tabellarische Daten ausgelegt sind. Daher kann die Verwendung dieser Methoden in Graphen Zeit in Anspruch nehmen, spezielle Fertigkeiten von Entwicklern erfordern und zu suboptimalen Vorhersagen führen.

Entwicklerproduktivität

Alles öffnen

Eigenschaftsdiagramme sind beliebt, da sie den Entwicklern vertraut sind, die den Umgang mit relationalen Modellen gewöhnt sind. Die Traversal-Sprache Gremlin bietet eine Möglichkeit, Property-Graphs schnell zu durchlaufen. Neptune unterstützt das Eigenschaftsdiagramm-Modell mit der Open-Source-Sprache Apache TinkerPop Gremlin Traversal und bietet einen Gremlin-Websockets-Server, der TinkerPop Version 3.3 unterstützt. Mit Neptune können Sie zügig schnelle Gremlin-Traversals über Property-Graphen erstellen. Vorhandene Gremlin-Anwendungen können Neptune problemlos nutzen, indem die Gremlin-Servicekonfiguration geändert wird, sodass sie auf eine Neptune-Instance verweist.

Das Resource Description Framework (RDF) ist beliebt, weil es Flexibilität für die Modellierung komplexer Informationsdomänen bietet. Es gibt eine Reihe von vorhandenen kostenlosen oder öffentlichen Datensätzen, die in RDF verfügbar sind, darunter Wikidata und PubChem, eine Datenbank chemischer Moleküle. Neptune unterstützt die Semantic Web-Standards des W3C für RDF 1.1 und SPARQL 1.1 (Query and Update) und bietet einen HTTP-REST-Endpunkt, der das SPARQL-Protokoll 1.1 implementiert. Mit Neptune können Sie einfach den SPARQL-Endpunkt für bestehende und neue Graph-Anwendungen verwenden.

Neptune unterstützt die Erstellung von Graphanwendungen mit openCypher, einer der derzeit beliebtesten Abfragesprachen für Entwickler, die mit Graphdatenbanken arbeiten. Entwickler, Geschäftsanalysten und Datenwissenschaftler schätzen die SQL-inspirierte Syntax von OpenCypher, weil sie eine vertraute Struktur zum Verfassen von Abfragen für Graphanwendungen bietet. Für Neptune Database können die Abfragesprachen OpenCypher und Gremlin zusammen für dieselben Eigenschaftsgraphdaten verwendet werden. Die Unterstützung für openCypher ist mit dem Bolt-Protokoll kompatibel, um weiterhin Anwendungen ausführen zu können, die das Bolt-Protokoll zur Verbindung mit Neptune verwenden.

Neptune unterstützt schnelles, paralleles Massenladen für Eigenschaftsdiagrammdaten, die in Amazon S3 gespeichert sind. Sie können eine REST-Schnittstelle verwenden, um den Amazon S3-Speicherort für die Daten anzugeben. Diese Schnittstelle nutzt das CSV-Trennformat, um Daten in Knoten und Edges zu laden. Weitere Informationen finden Sie in der Dokumentation zum Massenladen des Neptune-Eigenschaftsdiagramms.

Die Neptune-Datenbank unterstützt das schnelle, parallele Massenladen von RDF-Daten, die in Amazon S3 gespeichert sind. Sie können eine REST-Schnittstelle verwenden, um den Amazon S3-Speicherort für die Daten anzugeben. Es werden die Serialisierungen N-Triples (NT), N-Quads (NQ), RDF/XML und Turtle RDF 1.1 unterstützt. Weitere Informationen finden Sie in der Dokumentation zum Massenladen von Neptune RDF.