Pourquoi mon processus de réplication CloudEndure est-il bloqué à 100 % alors que le message « Finalizing Initial Sync » (« Finalisation de la synchronisation initiale ») s'affiche dans la console ?

Dernière mise à jour : 07/12/2020

J'utilise CloudEndure Migration ou CloudEndure Disaster Recovery. Le processus de réplication est bloqué à 100 % et le message « Finalizing initial sync » (« Finalisation de la synchronisation initiale ») s’affiche dans la console CloudEndure. Comment puis-je résoudre ce problème ?

Brève description

Deux messages sont susceptibles de s'afficher dans la console CloudEndure si le processus de réplication est bloqué à 100 % lors de l'étape finale de la synchronisation initiale :

  • « Finalisation de la synchronisation initiale - Vidage du backlog »
  • « Finalisation de la synchronisation initiale - Création du premier instantané exécutable » Cette erreur peut se produire pour les raisons suivantes :

Résolution

Finalisation de la synchronisation initiale - Vidage du backlog

Attendez que le vidage du backlog soit effectif pour que la synchronisation s'initialise.

Si la machine source dispose d’un cycle d’écriture très intensif, le volume du backlog peut augmenter progressivement. La ou les machines peuvent rester bloquées dans l'état Finalisation de la synchronisation initiale sur la console Cloudendure. Si cela se produit, procédez comme suit :

1.    Testez la vitesse de réplication. Après avoir testé la vitesse de réplication, calculez la bande passante requise, puis attribuez la bande passante à la machine source.

2.    Vérifiez que l'option de limitation de la bande passante réseau est désactivée sous Paramètres de réplication. Si votre configuration nécessite l'activation de cette option, assurez-vous que vous définissez la valeur sur au moins la bande passante minimale requise. Pour plus d'informations, voir [Facultatif] Activer la limitation de la bande passante réseau.

3.    Vérifiez l'utilisation du réseau ou du disque du serveur de réplication à l'aide des mesures Amazon CloudWatch. Si une ressource restreint le serveur, utilisez un serveur de réplication dédié ou choisissez d'utiliser des disques de données SSD rapides au lieu de disques durs.

Pour vérifier quel serveur de réplication une machine source spécifique utilise, exécutez la commande netstat sur la machine source, comme illustré dans l'exemple suivant. Notez l'adresse IP distante sur laquelle la machine se connecte sur le port 1500.

$ netstat -anp | grep ":1500"

Vous pouvez également consulter le fichier agent.log.0 sur la machine source pour identifier quel serveur de réplication précisément est utilisé :

$ sudo cat /var/lib/cloudendure/agent.log.0 | grep :1500 | tail -n 1

Finalisation de la synchronisation initiale - Création d'un premier instantané exécutable

Pour corriger cette erreur, suivez les étapes suivantes :

  • Vérifiez que la stratégie AWS Identity and Access Management (IAM) de l'utilisateur CloudEndure dispose de toutes les autorisations nécessaires pour exécuter les API Amazon Elastic Compute Cloud (Amazon EC2) requises.
  • Confirmez que le serveur de réplication communique avec les points de terminaison Amazon EC2 au sein de la région.
  • Identifiez tous les bloqueurs de connectivité réseau.
  • Vérifiez les modifications récentes apportées aux Paramètres de réplication.
  • Assurez-vous que vous utilisez les paramètres de proxy corrects.
  • Vérifiez que CloudEndure Agent fonctionne correctement.
  • Vérifiez les problèmes de quota de service.

Vérifiez que la stratégie IAM de l'utilisateur CloudEndure dispose de toutes les autorisations nécessaires pour exécuter les API Amazon EC2 requises

Pour obtenir un exemple de stratégie, consultez l' exemple de stratégie IAM. Ou, affichez l' historique des événements AWS CloudTrail pour confirmer toute défaillance d'API pour l'utilisateur IAM CloudEndure configuré.

Confirmez que le serveur de réplication communique avec les points de terminaison Amazon EC2 dans la région

1.    Lancez une nouvelle machine Linux dans le même sous-réseau que votre zone de transit.

2.    Connectez-vous à la nouvelle machine, puis exécutez les commandes suivantes pour tester la connectivité. Dans les exemples de commandes suivants, remplacez us-east-1 par votre région.

$ dig ec2.us-east-1.amazonaws.com
$ telnet ec2.us-east-1.amazonaws.com 443
$ wget https://ec2.us-east-1.amazonaws.com

L’échec de l'une des commandes ci-dessus indique l’existence de problèmes de connectivité réseau. Passez à la section suivante.

Identifier les bloqueurs de connectivité réseau

Vérifiez que les paramètres VPC, sous-réseau, groupe de sécurité, liste de contrôle d'accès réseau (ACL) et table de routage sont alignés sur les paramètres de réplication. Un défaut d'alignement peut bloquer la communication avec les points de terminaison Amazon EC2 depuis les serveurs de réplication.

Si le serveur de réplication s’exécute dans un sous-réseau public, procédez comme suit :

1.    Vérifiez que le groupe de sécurité, les ACL réseau et la table de routage autorisent la communication avec les points de terminaison Amazon EC2 sur le port TCP 443.

2.    Assurez-vous que les attributs enableDnsHostnames et enableDnsSupport sont définis sur « true » au niveau VPC :

$ aws ec2 describe-vpc-attribute --vpc-id vpc-a01106c2 --attribute enableDnsHostnames
$ aws ec2 describe-vpc-attribute --vpc-id vpc-a01106c2 --attribute enableDnsSupport

Si le serveur de réplication s’exécute dans un sous-réseau privé, procédez comme suit :

1.    Vérifiez que le groupe de sécurité, les ACL réseau et la table de routage autorisent la communication avec les points de terminaison Amazon EC2 sur le port TCP 443.

2.    Si vous avez configuré une instance NAT Gateway ou NAT dans la table de routage, vérifiez que le trafic sortant vers le point de terminaison Amazon EC2 sur le port TCP 443 circule correctement.

3.    Si vous avez configuré le trafic sortant pour passer par une passerelle de transit ou une passerelle réseau privé virtuel, vérifiez que la table de routage autorise le trafic sortant à atteindre les points de terminaison Amazon EC2 régionaux sur le port TCP 443.

4.    Vérifiez si un pare-feu interne ou externe bloque la communication.

5.    Si le VPC possède des points de terminaison de l’interface VPC, assurez-vous que la communication se produit entre les points de terminaison Amazon EC2 sur le port TCP 443 via un réseau privé. Pour ce faire :

Vérifiez que le groupe de sécurité associé au point de terminaison VPC autorise le trafic entrant de l'instance de réplication sur le port TCP 443.

Assurez-vous que les attributs enableDnsHostnames et enableDnsSupport sont définis sur « true » au niveau VPC. Vérifiez également que la valeur PrivatednsenEnabled est définie sur true sur les points de terminaison de l'interface VPC.

$ aws ec2 describe-vpc-attribute --vpc-id vpc-a01106c2 --attribute enableDnsHostnames
$ aws ec2 describe-vpc-attribute --vpc-id vpc-a01106c2 --attribute enableDnsSupport
$ aws ec2 describe-vpc-endpoints --vpc-endpoint-ids vpce-088d25a4bbf4a7abc

Recherchez les modifications récentes dans les paramètres de réplication

Vous pouvez suivre les modifications apportées aux Paramètres de réplication à partir du journal des événements CloudEndure. Par exemple, vérifiez si une balise non valide est insérée dans le champ Balises de zone de transit . Pour obtenir la liste des caractères autorisés, reportez-vous à Restrictions de balise.

Assurez-vous que vous utilisez les paramètres de proxy corrects

1.    Si vos serveurs de réplication utilisent un serveur proxy, assurez-vous que les paramètres des proxys permettent la communication avec les points de terminaison Amazon EC2 régionaux sur le port TCP 443.

2.    Assurez-vous que la liste autorisée pour l'interception et l'authentification SSL inclut console.cloudendure.com. Pour plus d'informations, consultez la section Définir le proxy dans Définir les paramètres de réplication pour AWS.

Confirmez que le CloudEndure Agent fonctionne correctement

Vérifiez que le CloudEndure Agent fonctionne correctement sur la machine source. Vous pouvez vérifier les journaux du CloudEndure Agent pour détecter d'éventuelles erreurs afin d’identifier les problèmes éventuels.

Rechercher les problèmes de quota de service Amazon EC2

Lesproblèmes de quota de service ou de limitation des API et de limite de débit peuvent empêcher CloudEndure de créer le premier instantané de récupération exécutable. Vérifiez l' historique des événements CloudTrail pour déterminer s'il existe un problème de quota de service ou de limitation.

Pour plus d'informations, consultez la section Quotas de service Amazon EC2.</p


Cet article vous a-t-il été utile ?


Besoin d'aide pour une question technique ou de facturation ?