Questions d'ordre général

Q : Qu’est-ce qu’AWS DataSync ?

R : AWS DataSync est un service de transfert de données en ligne géré qui simplifie, automatise et accélère le transfert et la réplication via Internet ou AWS Direct Connect de grands volumes de données entre des systèmes de stockage sur site et les services de stockage AWS tels qu’Amazon S3 et Amazon EFS.

Q : Quels sont les avantages d’AWS DataSync ?

R : AWS DataSync permet de transférer, copier et synchroniser de grands ensembles de données comportant des millions de fichiers, sans avoir à créer des solutions sur mesure avec des outils à code source libre ou à acquérir une licence et gérer des logiciels commerciaux d’accélération réseau onéreux. Vous pouvez utiliser DataSync pour une migration ponctuelle de données actives, une répartition périodique des flux de travail de traitement de données ou une réplication continue à des fins de continuité des activités.

Q : Quelle est l’utilité de DataSync ?

R : DataSync réduit la complexité et le coût du transfert des données en ligne, ce qui simplifie le transfert d’ensembles de données entre les systèmes de stockage de données sur site et Amazon S3 ou Amazon Elastic File System (EFS). DataSync se connecte aux systèmes de stockage et aux sources de données existants via un protocole de stockage standard (NFS). Il utilise un protocole réseau dédié et met l’architecture à l’échelle pour accélérer le transfert de données vers et depuis AWS. DataSync se met automatiquement à l’échelle et gère toutes les tâches relatives au transfert de données. Il surveille la progression du transfert, ainsi que le chiffrement et la validation de ce dernier et informe le client de toute défaillance constatée. Avec DataSync, vous ne payez que pour le volume de données copiées, sans engagement minimal ni frais initiaux.

Q : Depuis et vers quels systèmes puis-je transférer des données ?

R : DataSync peut copier des données sur les systèmes de stockage sur site, Amazon S3 et Amazon EFS. DataSync utilise le protocole NFS pour accéder aux systèmes de stockage sur site.

Configuration

Q : Comment démarrer avec DataSync ?

R : Vous pouvez transférer des données avec DataSync en quelques clics dans AWS Management Console ou via l’interface de ligne de commande (CLI) AWS. Pour démarrer, déployez un agent DataSync dans votre environnement informatique, configurez l’emplacement source et cible, puis lancez la copie.

Q : Comment déployer un agent DataSync ?

R : Pour déployer un agent DataSync, téléchargez le fichier .ova dans la console AWS et déployez-le dans votre hyperviseur sur site VMware ESXi. Vous devez déployer l’agent dans votre environnement informatique afin qu’il puisse accéder à votre serveur NFS sur site.

Q : Quelles sont les exigences en matière de ressources requises pour l’agent DataSync ?

R : Chaque agent nécessite les ressources minimales ci-dessous :

4 processeurs virtuels (4 vCPU) attribués à la machine virtuelle ;

32 Go de mémoire RAM attribués à la machine virtuelle ;

80 Go d'espace disque pour l'installation de l'image de machine virtuelle et les données système.

Utilisation

Q : Comment utiliser DataSync ?

R : 1. Déployer un agent – Déployez un agent DataSync sur site et associez-le à votre compte AWS via l’API ou Management Console. L'agent sera utilisé pour accéder à votre NFS local pour la lecture ou l’écriture des données qu'il contient Vous n’avez pas besoin de déployer des agents sur EC2 ou de gérer quelques ressources cloud que ce soit.

2. Créer une tâche de transfert de données – Créez une tâche en précisant l'endroit de vos source et destination de données et toute option que vous souhaitez utiliser pour configurer le transfert, par exemple la copie de métadonnées de fichiers.

3. Démarrer le transfert – Démarrez la tâche et surveillez les déplacements de données dans la console ou avec Amazon CloudWatch.

Q : Comment démarrer une tâche DataSync ?

R : DataSync copie les données lorsque vous initiez une tâche via AWS Management Console ou l’interface de ligne de commande. Chaque fois qu’une tâche est exécutée, DataSync recherche dans la source toute modification et copie toutes les différences entre la source vers la destination. Vous pouvez configurer les caractéristiques de la source à utiliser pour déterminer ce qui a changé, et si les fichiers ou les objets dans la destination doivent être supprimés lorsqu’ils sont absents dans la source.

Q : Comment DataSync effectue-t-il la validation de l’intégrité des données ?

R : DataSync vérifie l’intégrité des données aussi bien pendant le transfert qu’à la fin de celui-ci (comparaison du total de contrôle entre les fichiers source et de destination et comparaison des métadonnées de fichiers).

Q : Comment surveiller le statut des données transférées par DataSync ?

R : Vous pouvez utiliser AWS Management Console ou l’interface de ligne de commande pour surveiller le statut des données transférées. Les métriques Amazon CloudWatch vous permettent de connaître le nombre de fichiers et le volume des données copiées. Pour obtenir les détails sur les informations d’erreur, utilisez Amazon CloudWatch Logs. Par ailleurs, les événements CloudWatch sont déclenchés dès que démarre la transition de vos tâches, ce qui permet l’automatisation des flux de travail dépendants. Pour plus d’informations sur la progression du transfert, veuillez consulter AWS Management Console ou l’interface de ligne de commande (CLI).

Q : Comment DataSync accède-t-il à mon système de fichiers sur site ?

R : DataSync utilise les agents que vous avez déployés dans votre environnement informatique pour accéder à vos systèmes de fichiers sur site, via le protocole NFS. Ces agents se connectent à AWS via Internet ou votre AWS Direct Connect, et sont gérés de manière sécurisée depuis AWS Management Console ou l’interface de ligne de commande (CLI). Vous n’avez pas besoin de configurer un VPN ou un tunnel ou d’autoriser les connexions entrantes ; les agents peuvent être configurés pour contourner les pare-feu, en utilisant des ports réseau standard.

Q : Comment DataSync accède-t-il à mon compartiment Amazon S3 ?

R : DataSync accède à votre compartiment Amazon S3 à l’aide du rôle IAM que vous avez configuré.

Q : Comment DataSync accède-t-il à mon système de fichiers Amazon EFS ?

R : DataSync accède à votre système de fichiers Amazon EFS via le protocole NFS. Pour ce faire, il monte votre système de fichiers à partir de l’intérieur de votre VPC en utilisant les interfaces réseau Elastic (ENI) gérées par DataSync. DataSync gère entièrement la création, l’utilisation et la suppression de ces ENI en vos lieu et place.

Q : Lors du transfert de fichiers vers ou depuis Amazon S3, comment DataSync établit-il la correspondance entre les fichiers et les objets ?

R : Lors de la copie de fichiers vers des objets, une relation « un à un » s’établit entre un fichier et un objet. Les métadonnées du système de fichiers sont stockées dans les métadonnées utilisateur S3. Les métadonnées sont restaurées lorsque les objets contenant les métadonnées du système de fichiers sont copiés en retour vers les fichiers.

Q : Quelles métadonnées DataSync préserve-t-il lors du transfert de données ?

R : DataSync préserve les métadonnées POSIX telles que l’identifiant utilisateur, l’identifiant de groupe et les autorisations, ce qui garantit la possibilité de restaurer les fichiers dans leur emplacement initial sans perdre lesdites métadonnées. Par ailleurs, lors du stockage des métadonnées POSIX depuis des fichiers pour des objets dans S3, ces métadonnées peuvent être interpolées grâce à la passerelle de fichier.

Q : Puis-je utiliser le contrôle de version, le cycle de vie, la réplication entre régions et la notification d'événements S3 sur DataSync ?

R : Oui. Vos politiques de compartiment en matière de contrôle de version, de gestion du cycle de vie, de réplication entre régions et de notification d'événements S3 s'appliquent directement aux objets transférés dans votre compartiment via DataSync.

Lors de l’utilisation du contrôle de version, sachez que les modifications apportées aux métadonnées d’objets créeront une nouvelle version de l’objet.

Vous pouvez utiliser les politiques de cycle de vie S3 pour modifier le niveau de stockage d'un objet ou supprimer d'anciens objets ou d'anciennes versions d'objet.

Q : Mes données sont-elles chiffrées durant leur transfert et leur stockage ?

R : Oui. Toutes les données transférées entre la source et la destination sont chiffrées via Transport Layer Security (TLS, qui remplace Secure Sockets Layer, SSL). Les données ne sont pas conservées au sein de DataSync. Le service prend en charge le chiffrement par défaut pour les compartiments S3 et le chiffrement des systèmes de fichiers Amazon EFS pour les données au repos.

Q : Que se passe-t-il en cas d’interruption d’une tâche DataSync ?

R : En cas d’interruption d’une tâche DataSync, par exemple si la connexion réseau s’arrête ou si l’agent DataSync est redémarré, les fichiers manquants seront transférés lors de la prochaine exécution de la tâche, et les données seront ainsi complètes et cohérentes à la fin de l’opération. À chaque redémarrage d’une tâche, le système effectue une copie incrémentielle, ne transférant que les modifications de la source vers la destination.

Q :Puis-je utiliser DataSync avec AWS Direct Connect ?

R : Oui. Vous pouvez utiliser DataSync avec votre liaison Direct Connect pour accéder aux points de terminaison Internet publics, sans avoir à effectuer de configurations particulières.

Performances

Q : Quelle est la vitesse de copie de mon système de fichiers vers AWS via DataSync ?

R : La vitesse de copie d’un ensemble de données via DataSync est fonction du volume des données, de la bande passante E/S pouvant être atteinte entre le stockage source et celui cible, de la bande passante réseau disponible et des caractéristiques du réseau. Un seul agent DataSync peut saturer une liaison réseau de 10 Go/s.

Q : Puis-je contrôler le volume de bande passante consommé par une tâche DataSync ?

R : Oui. Vous pouvez contrôler le volume de bande passante consommé par DataSync en configurant le système de limitation de bande passante intégré. Cela permet de minimiser l’impact de cette consommation sur les autres utilisateurs ou applications utilisant la même connexion réseau.

Q : DataSync affecte-t-il les performances de mon système de fichiers source ?

R : En fonction de la capacité de votre stockage sur site et de la quantité et de la taille des fichiers à transférer, DataSync peut affecter le délai de réponse des autres clients ayant accès au même stockage de données, car l’agent effectue la lecture ou l’écriture des données depuis ce système de stockage. Configurer la limite de bande passante pour une tâche permet de réduire cet impact en limitant les E/S de votre système de stockage.

Conformité

Q : Quels sont les programmes de conformité pris en charge par DataSync ?

R : AWS possède le programme de conformité le plus long du cloud, et a à cœur d’aider les clients à répondre à leurs besoins. DataSync a été évaluée conforme aux normes de sécurité mondiale et du secteur. Il satisfait aux normes PCI DSS, ISO 9001, 27001, 27017 et 27018 et est éligible à l’HIPAA. Vous pouvez ainsi vérifier votre sécurité et satisfaire à vos propres exigences en toute simplicité. Pour plus d'informations, consultez nos pages sur la conformité. Vous pouvez également consulter la page Services concernés par le programme de conformité pour voir la liste complète des services et certifications.

Q : DataSync est-il conforme à la norme PCI ?

R : Oui. DataSync est conforme à la norme PCI-DSS, ce qui signifie que vous pouvez l’utiliser pour transférer des informations de paiement. Vous pouvez télécharger le package de conformité PCI sur AWS Artefact pour en savoir plus sur comment obtenir la conformité PCI sur AWS.

Q : DataSync est-il éligible à l’HIPAA ?

R : Oui. DataSync est éligible à l’HIPAA. En d’autres termes, si vous possédez un HIPAA BAA sur AWS, vous pouvez utiliser DataSync pour transférer des informations protégées relatives à la santé (PHI).

Quand choisir AWS DataSync

Q : Comment choisir entre AWS DataSync et la famille AWS Snowball Edge ?

R : AWS Snowball Edge est recommandé pour les clients qui n’ont pas besoin de leurs données dans AWS dans l’immédiat, qui ont des contraintes de bande passante, ainsi que pour le transfert de données depuis des environnements distants, déconnectés ou austères. DataSync est indiqué pour les clients en quête de migrations en ligne d’ensemble de données actives, pour les transferts rapides de données générées en continu ou pour la réplication à des fins de continuité des activités.

Q : Comment choisir entre AWS DataSync et AWS Storage Gateway ?

R : AWS Storage Gateway offre des capacités de stockage cloud hybride permettant de connecter des applications sur site aux services de stockage AWS avec un accès à faible latence. Il est utilisé pour la sauvegarde, la création de niveaux, et l’accès local aux objets stockés sur S3. DataSync permet de copier rapidement des données vers ou depuis les services de stockage AWS. Vous pouvez utiliser DataSync pour transférer rapidement des données existantes sur Amazon S3. Vous pouvez également utiliser la configuration de la passerelle de fichier de Storage Gateway pour accéder ultérieurement et avec une faible latence auxdites données depuis votre environnement sur site.

 

Q : Comment choisir entre AWS DataSync et S3 Transfer Acceleration ?

R : Si vos applications intègrent déjà l’API Amazon S3 et que vous avez besoin d’un débit plus élevé pour transférer de grands volumes de fichiers vers S3, vous pouvez opter pour S3 Transfer Acceleration. DataSync est recommandé si vous souhaitez transférer des données depuis des systèmes de stockage existants, par exemple un stockage en réseau, ou des instruments immuables, par exemple les séquenceurs d’ADN et les caméras vidéo, ou si vous souhaitez transférer des données vers plusieurs destinations.

Product-Page_Standard-Icons_01_Product-Features_SqInk
En savoir plus sur la tarification

AWS DataSync utilise une tarification simple, prévisible et basée sur l’utilisation. Vous ne payez que pour le volume de données que vous copiez.  

En savoir plus 
Product-Page_Standard-Icons_02_Sign-Up_SqInk
Créer gratuitement un compte

Obtenez un accès instantané à l'offre gratuite d'AWS. 

S'inscrire 
Product-Page_Standard-Icons_03_Start-Building_SqInk
Commencez à transférer des données dans la console

Commencez à créer avec AWS DataSync dans la console AWS.

Se connecter