Allgemeines

F: Was ist AWS DataSync?

A: AWS DataSync ist ein verwalteter Online-Datenübertragungsservice, der die Bewegung und Replikation großer Datenmengen zwischen standortbasierten Speichersystemen und AWS-Speichersystemen wie Amazon S3 und Amazon EFS über das Internet oder über AWS Direct Connect vereinfacht, automatisiert und beschleunigt.

F: Warum sollte ich AWS DataSync verwenden?

A: Mit AWS DataSync können Sie Datensätze mit Millionen von Dateien bewegen, kopieren und synchronisieren, ohne angepasste Lösungen mit Open-Source-Tools entwickeln oder Lizenzen für teure kommerzielle Netzwerkbeschleunigungssoftware erwerben und diese Lösung verwalten zu müssen. Sie können DataSync für die einmalige Migration aktiver Daten verwenden und außerdem für die regelmäßige Verteilung im Rahmen von Datenverarbeitungsworkflows oder für die laufende Replikation zur Sicherstellung der Betriebskontinuität.

F: Welche Probleme hilft DataSync zu lösen?

A: DataSync reduziert die Komplexität und Kosten der Online-Datenübertragung und vereinfacht damit die Übertragung von Datensätzen zwischen standortbasierten Speichersystemen und Amazon S3 oder Amazon Elastic File System (EFS). DataSync stellt über ein Standardspeicherprotokoll (NFS) eine Verbindung zu vorhandenen Speichersystemen und Datenquellen her und verwendet ein spezielles Netzwerkprotokoll sowie eine spezielle Scale-Out-Architektur, um die Übertragung nach und von AWS zu beschleunigen. DataSync skaliert und verwaltet automatisch alle Aufgaben, die mit der Bewegung von Daten, der Überwachung des Übertragungsfortschritts, der Verschlüsselung und Validierung von Datenübertragungen und der Benachrichtigung der Kunden bei Fehlern im Zusammenhang stehen. Bei DataSync zahlen Sie nur die Menge der kopierten Daten und es fallen keine Mindestverpflichtungen oder Vorabgebühren an.

F: Welche Quellen und Ziele für die Datenübertragung kann ich nutzen?

A: DataSync kopiert Daten zwischen standortbasierten Speichersystemen und Amazon S3 und Amazon EFS. DataSync unterstützt das NFS-Protokoll für den Zugriff auf das standortbasierte Speichersystem.

Einrichtung

F: Was sind die ersten Schritte mit DataSync?

A: Mit DataSync können Sie Daten mit nur wenigen Klicks in der AWS-Managementkonsole oder über die AWS-Befehlszeilenschnittstelle (CLI) übertragen. Zu Beginn müssen Sie einen DataSync-Agenten in Ihrer IT-Umgebung bereitstellen, anschließend konfigurieren Sie den Quell- und den Zielstandort und initiieren dann den Kopiervorgang.

F: Wie gehe ich vor, um einen DataSync-Agenten bereitzustellen?

A: Sie stellen einen DataSync-Agenten bereit, indem Sie ein OVA-Paket aus der AWS Console herunterladen und es auf Ihrem standortbasierten VMware ESXi-Hypervisor bereitstellen. Der Agent muss in Ihrer IT-Umgebung bereitgestellt werden, damit er auf Ihren standortbasierten NFS-Server zugreifen kann.

F: Welche Ressourcenanforderungen müssen für den DataSync-Agenten erfüllt sein?

A: Für jeden Agenten sind die folgenden Mindestressourcen erforderlich:

Vier virtuelle Prozessoren (4 vCPU), die der VM zugewiesen sind

32 GB Arbeitsspeicher (RAM), die der VM zugewiesen sind

80 GB Festplattenspeicherplatz für die Installation von VM-Image- und Systemdaten

Verwendung

F: Wie nutze ich DataSync?

A: 1. Agenten bereitstellen – Stellen Sie einen standortbasierten DataSync-Agenten bereit und weisen Sie ihn über die Managementkonsole oder die API Ihrem AWS-Konto zu. Der Agent wird dazu verwendet, auf Ihren lokalen NFS-Speicher zuzugreifen, um Daten zu lesen oder zu überschreiben. Es ist nicht erforderlich, Agenten auf EC2 bereitzustellen oder Ressourcen in der Cloud zu verwalten.

2. Datenübertragungsaufgabe erstellen – Erstellen Sie eine Aufgabe, indem Sie den Standort der Datenquelle und das Ziel sowie weitere Optionen definieren, die Sie für die Konfiguration der Datenübertragung verwenden möchten, z. B. das Kopieren von Datei-Metadaten.

3. Übertragung starten – Starten Sie die Aufgabe und überwachen Sie die Datenübertragung über die Konsole oder mit Amazon CloudWatch.

F: Wie starte ich eine DataSync-Aufgabe?

A: DataSync kopiert Daten, wenn Sie eine entsprechende Aufgabe über die AWS-Managementkonsole oder die Befehlszeilenschnittstelle (CLI) initiieren. Bei jeder Ausführung der Aufgabe wird die Quelle auf Änderungen überprüft, außerdem wird eine Kopie aller Abweichungen zwischen Quelle und Ziel erstellt. Sie können festlegen, welche Merkmale der Quelle verwendet werden sollen, um zu bestimmen, was sich geändert hat und ob Dateien oder Objekte auf dem Ziel gelöscht werden sollen, wenn sie auf der Quelle nicht vorhanden sind.

F: Wie führt DataSync die Datenintegritätsvalidierung durch?

A: DataSync führt während und am Ende der Übertragung eine Datenintegritätsvalidierung (anhand eines Prüfsummenvergleichs zwischen Quell- und Zieldateien sowie anhand eines Vergleich der Datei-Metadaten) durch.

F: Wie kann ich den Status der von DataSync übertragenen Daten überwachen?

A: Über die AWS-Managementkonsole oder die Befehlszeilenschnittstelle (CLI) können Sie den Status der übertragenen Daten überwachen. Mit Amazon CloudWatch können Sie die Anzahl der kopierten Dateien und das kopierte Datenvolumen anzeigen. Für detaillierte Fehlerinformationen können Sie Amazon CloudWatch Logs verwenden. Darüber hinaus werden CloudWatch Events ausgelöst, während Ihre Aufgaben von einem Status in einen anderen Status übergehen. Damit können Sie abhängige Workflows automatisieren. Zusätzliche Informationen, wie z. B. zum Fortschritt der Übertragung, finden Sie in der AWS-Managementkonsole oder in der Befehlszeilenschnittstelle (CLI).

F: Wie greift DataSync auf mein standortbasiertes Dateisystem zu?

A: DataSync verwendet Agenten, die Sie in Ihrer IT-Umgebung über das NFS-Protokoll für den Zugriff auf Ihre standortbasierten Dateisysteme bereitgestellt haben. Diese Agenten verbinden sich über das Internet oder über Ihr AWS Direct Connect mit AWS und werden über die AWS-Managementkonsole oder die Befehlszeilenschnittstelle (CLI) sicher verwaltet. Es ist nicht erforderlich, einen VPN/Tunnel einzurichten oder eingehende Verbindungen zuzulassen, und die Agenten können so konfiguriert werden, dass sie über Standardnetzwerkports durch eine Firewall geleitet werden.

F: Wie greift DataSync auf meinen Amazon S3-Bucket zu?

A: DataSync greift über eine von Ihnen konfigurierte IAM-Rolle auf Ihren Amazon S3-Bucket zu.

F: Wie greift DataSync auf mein Amazon EFS-Dateisystem zu?

A: DataSync greift über das NFS-Protokoll auf Ihr Amazon EFS-Dateisystem zu. Dabei wird Ihr Dateisystem aus Ihrer VPC über Elastic Network-Schnittstellen (ENIs), die von DataSync verwaltet werden, gemountet. Das Erstellen, Verwenden und Löschen dieser EN-Schnittstellen wird in Ihrem Namen vollständig von DataSync verwaltet.

F: Wenn Dateien nach oder von Amazon S3 übertragen werden, wie erfolgt die Zuordnung von Dateien und Objekten durch DataSync?

A: Wenn Dateien in Objekte kopiert werden, wird eine 1:1-Beziehung zwischen einer Datei und einem Objekt erstellt. Dateisystem-Metadaten werden in S3-Benutzermetadaten gespeichert. Metadaten werden wiederhergestellt, wenn Objekte mit Dateisystem-Metadaten zurück in Dateien kopiert werden.

F: Welche Metadaten erhält DataSync bei der Übertragung von Daten?

A: DataSync erhält POSIX-Metadaten wie die Benutzer-ID, die Gruppen-ID sowie Berechtigungen und stellt damit sicher, dass Dateien an ihrem ursprünglichen Speicherort ohne Verlust dieser Metadaten wiederhergestellt werden können. Außerdem sind die Metadaten, wenn POSIX-Metadaten aus Dateien für Objekte in S3 gespeichert werden, auch mit File Gateway nutzbar.

F: Kann ich mit DataSync Versionsverwaltung, Lebenszyklus, regionsübergreifende Replikation und S3-Ereignisbenachrichtigung nutzen?

A: Ja. Ihre Bucket-Richtlinien für Versionsverwaltung, Lebenszyklusverwaltung, regionsübergreifende Replikation und S3-Ereignisbenachrichtigung werden direkt auf Objekte angewendet, die über DataSync in Ihren Bucket übertragen werden.

Wenn Sie die Versionsverwaltung verwenden, beachten Sie, dass Änderungen an Objektmetadaten eine neue Version des Objekts zur Folge haben.

Sie können S3-Lebenszyklus-Richtlinien verwenden, um das Speicherkontingent eines Objekts zu verändern oder um alte Objekte oder Objektversionen zu löschen.

F: Sind meine Daten während der Übertragung und Speicherung verschlüsselt?

A: Ja. Alle Daten, die zwischen der Quelle und dem Ziel übertragen werden, werden über das TLS-Protokoll (Transport Layer Security) verschlüsselt, wobei TLS das SSL-Protokoll (Secure Sockets Layer) abgelöst hat. Daten werden niemals in DataSync selbst erhalten. Der Service unterstützt die Verwendung der Standardverschlüsselung für S3-Buckets und die Amazon EFS-Dateisystem-Verschlüsselung von Daten während der Speicherung.

F: Was geschieht, wenn eine DataSync-Aufgabe unterbrochen wird?

A: Wenn eine Aufgabe unterbrochen wird (z. B. wenn die Netzwerkverbindung verloren geht oder der DataSync-Agent neu gestartet wird), werden die fehlenden Dateien bei der nächsten Ausführung der Aufgabe übertragen, und die Daten sind am Ende dieses Laufs vollständig und konsistent. Bei jedem Start einer Aufgabe wird eine inkrementelle Kopie erstellt, sodass nur die Änderungen von der Quelle auf das Ziel übertragen werden.

F: Kann ich DataSync mit AWS Direct Connect verwenden?

A: Ja. Sie können DataSync mit Ihrem Direct Connect-Link verwenden, um so ohne zusätzliche Konfiguration auf öffentliche Internet-Endpunkte zuzugreifen.

Leistung

F:  Wie schnell kann DataSync mein Dateisystem nach AWS kopieren?

A: Die Geschwindigkeit, mit der DataSync einen vorhandenen Datensatz kopieren kann, ist eine Funktion aus der Datenmenge, der E/A-Bandbreite, die auf den Quell- und Zielspeichern unterstützt wird, der verfügbaren Netzwerkbandbreite sowie den Netzwerkbedingungen. Ein einzelner DataSync-Agent ist in der Lage, einen Netzwerk-Link mit 10 GBit/s voll auszuschöpfen.

F: Kann ich die Menge der Netzwerkbandbreite steuern, die von einer DataSync-Aufgabe beansprucht wird?

A: Ja, Sie können die Menge der Netzwerkbandbreite steuern, die von DataSync beansprucht wird. Konfigurieren Sie dazu die integrierte Bandbreitendrosselung. Damit können Sie die Auswirkungen auf andere Benutzer oder Anwendungen minimieren, die von der gleichen Netzwerkverbindung abhängig sind.

F: Wirkt sich DataSync auf die Leistung meines Quelldateisystems aus?

A: Abhängig von der Kapazität Ihres standortbasierten Dateispeichers sowie der Menge und der Größe der zu übertragenden Dateien kann sich DataSync auf die Reaktionszeit anderer Clients auswirken, wenn diese auf den gleichen Quelldatenspeicher zugreifen, da der Agent Daten auf diesem Speichersystem liest und überschreibt. Wenn Sie eine Bandbreitenbegrenzung für eine Aufgabe konfigurieren, können Sie diese Auswirkung durch die E/A-Begrenzung auf Ihrem Speichersystem reduzieren.

Compliance

F: Welche Compliance-Programme werden von DataSync unterstützt?

A: AWS hat das am längsten laufende Compliance-Programm in der Cloud und fühlt sich verpflichtet, Kunden bei der Definition ihrer Anforderungen zu unterstützen. DataSync wurde so bewertet, dass es die weltweiten und branchenspezifischen Sicherheitsstandards erfüllt. Es erfüllt die Standards PCI DSS, ISO 9001, 27001, 27017 und 27018 und ist außerdem geeignet für HIPAA. So ist es für Sie einfacher, unsere Sicherheit zu überprüfen und Ihre eigenen Verpflichtungen zu erfüllen. Weitere Informationen und Ressourcen finden Sie auf unseren Compliance-Seiten. Eine vollständige Liste der Services und Zertifikate finden Sie außerdem auf der Seite Services in Scope nach Compliance-Programm.

F: Wurde DataSync PCI-konform entwickelt?

A: Ja. DataSync ist PCI-DSS-konform; dies bedeutet, dass Sie es für die Übertragung von Zahlungsdaten verwenden können. Sie können das PCI Compliance Package in AWS Artifact herunterladen, um mehr darüber zu erfahren, wie Sie PCI-Compliance auf AWS erreichen können.

F: Ist DataSync geeignet für HIPAA?

A: Ja. DataSync ist für HIPAA geeignet; wenn Sie also eine HIPAA-BAA mit AWS vereinbart haben, können Sie DataSync für die Übertragung von geschützten Gesundheitsdaten (PHI) verwenden.

Entscheidungshilfe für AWS DataSync

F: Was hilft mir bei der Entscheidung, wenn ich zwischen AWS DataSync und der AWS Snowball Edge-Familie wählen kann?

A: AWS Snowball Edge wurde für Kunden entwickelt, deren Daten nicht sofort in AWS verfügbar sein müssen, deren Bandbreiten eingeschränkt ist oder die Daten von Remote-, nicht verbundenen oder schwierigen Umgebungen aus übertragen müssen. DataSync eignet sich optimal für Kunden, die auf die Online-Migration aktiver Datensätze, auf zeitgerechte Übertragungen für kontinuierlich generierte Daten oder die Replikation zur Gewährleistung der Betriebskontinuität angewiesen sind.

F: Was hilft mir bei der Entscheidung, wenn ich zwischen AWS DataSync und AWS Storage Gateway wählen kann?

A: AWS Storage Gateway bietet hybride Cloud-Speichermöglichkeiten, indem es standortbasierte Anwendungen mit AWS-Speicherservices auf Basis eines niedrig latenten Zugriffs verbindet, und wird für Sicherungen, Tiering und den lokalen Zugriff auf in S3 gespeicherte Objekte verwendet. DataSync wird für das schnelle Kopieren von Daten in die AWS-Speicherservices oder aus diesen Services heraus verwendet. Sie können DataSync für die schnelle Übertragung vorhandener Daten nach Amazon S3 und die File Gateway-Konfiguration des Storage Gateway für den nachfolgenden niedrig latenten Zugriff auf diese Daten von standortbasierten Quellen verwenden.

 

F: Was hilft mir bei der Entscheidung, wenn ich zwischen AWS DataSync und S3 Transfer Acceleration wählen kann?

A: Wenn Ihre Anwendungen bereits in die Amazon S3-API integriert sind und Sie einen höheren Durchsatz für die Übertragung größerer Dateien nach S3 wünschen, können Sie S3 Transfer Acceleration verwenden. Wenn Sie Daten von vorhandenen Speichersystemen (z. B. Network Attached Storage) oder von Instrumenten, die nicht geändert werden können (z. B. DNA-Sequenzierer, Videokameras), übertragen möchten, oder wenn Sie mehrere Ziele konfigurieren möchten, sollten Sie sich für DataSync entscheiden.

Product-Page_Standard-Icons_01_Product-Features_SqInk
Weitere Informationen über die Preisberechnung

AWS DataSync bietet eine einfache, vorhersehbare nutzungsabhängige Preisstruktur, denn Sie zahlen nur für die kopierte Datenmenge.  

Weitere Informationen 
Product-Page_Standard-Icons_02_Sign-Up_SqInk
Registrieren Sie sich und erhalten Sie ein kostenloses Konto

Sie erhalten sofort Zugriff auf das kostenlose AWS-Kontingent. 

Registrieren 
Product-Page_Standard-Icons_03_Start-Building_SqInk
Beginnen Sie mit der Datenbewegung in der Konsole

Beginnen Sie mit dem Aufbau von AWS DataSync in der AWS Console.

Anmeldung