Comment puis-je optimiser les performances de transfert de fichiers via Direct Connect ?

Date de la dernière mise à jour : 11/01/2022

Je rencontre des problèmes de lenteurs de transfert de fichiers sur ma connexion AWS Direct Connect.

Résolution

Suivez les étapes de dépannage suivantes pour votre cas d'utilisation.

Remarque : si vous recevez des erreurs lors de l'exécution de commandes AWS CLI (AWS Command Line Interface), assurez-vous d'utiliser la version la plus récente d'AWS CLI.

Utilisation des métriques Amazon CloudWatch pour vérifier la surutilisation et les erreurs de la connexion Direct Connect

Vous pouvez utiliser les métriques CloudWatch pour surveiller les connexions Direct Connect et les interfaces virtuelles. Pour les connexions dédiées Direct Connect, vérifiez les métriques ConnectionBpsEgress et ConnectionBpsIngress pour connaître les valeurs qui dépassent la vitesse des ports réseau. Vérifiez la métrique ConnectionErrorCount pour connaître les erreurs au niveau de MAC. Pour plus d'informations sur la résolution des erreurs au niveau de MAC, consultez ConnectionErrorCount dans Métriques de connexion Direct Connect.

Pour les connexions hébergées, vérifiez les métriques VirtualInterfaceBpsEgress et VirtualInterfaceBpsIngress. Vous ne pouvez créer qu'une seule interface virtuelle Direct Connect pour chaque connexion hébergée. Ces métriques sont une estimation du débit binaire total du trafic réseau pour la connexion hébergée.

Pour plus d'informations, consultez Affichage des métriques CloudWatch Direct Connect.

Optimisation des performances lors du chargement de fichiers volumineux vers Amazon Simple Storage Service (Amazon S3)

Pour le chargement des fichiers volumineux vers Amazon S3, il est conseillé d'utiliser les chargements partitionnés. Si vous utilisez AWS CLI, toutes les commandes Amazon S3 de haut niveau, telles que cp et sync, effectuent automatiquement des chargements partitionnés pour les fichiers volumineux.

Utilisez les valeurs de configuration Amazon S3 d'AWS CLI suivantes :

  • max_concurrent_requests – nombre maximum de demandes simultanées. La valeur par défaut est 10. Assurez-vous de disposer de suffisamment de ressources pour prendre en charge le nombre maximum de demandes.
  • max_queue_size – nombre maximum de tâches dans la file d'attente des tâches.
  • multipart_threshold – seuil de taille que l'interface de ligne de commande utilise pour les transferts partitionnés de fichiers individuels.
  • multipart_chunksize – lorsque vous utilisez des transferts partitionné, il s'agit de la taille de segment que l'interface de ligne de commande utilise pour les transferts partitionnés de fichiers individuels. Cette valeur définit la taille de chaque partie qu'AWS CLI charge dans un chargement partitionné pour un fichier individuel. Ce paramètre vous permet de diviser un fichier plus volumineux (par exemple 300 Mo) en plusieurs parties plus petites, ce qui permet des vitesses de chargement plus rapides. La valeur par défaut est de 8 Mo, et la valeur minimale que vous pouvez définir est de 5 Mo.

Remarque : un chargement partitionné nécessite qu'un seul fichier soit chargé en un maximum de 10 000 parties. Assurez-vous que la taille des parties que vous définissez équilibre la taille du fichier totale et le nombre de parties.

  • max_bandwidth – bande passante maximale qui est consommée pour le chargement et le téléchargement de données vers et depuis Amazon S3.

Pour plus d'informations, consultez Migrer de petits ensembles de données sur site vers Amazon S3 à l'aide d'AWS SFTP.

Réglage des performances pour les serveurs de fichiers Windows Server Message Block (SMB)

Pour optimiser les performances réseau des serveurs de fichiers Windows SMB, le protocole Server Message Block (SMB) 3.0 doit être négocié entre chaque client et chaque serveur de fichiers. Cela est dû au fait que SMB 3.0 utilise le protocole qui améliore les performances des serveurs de fichiers SMB, notamment les fonctions suivantes :

  • SMB Direct – cette fonction garantit que SMB détecte les interfaces réseau RDMA sur le serveur de fichiers et utilise automatiquement l'accès direct à distance à la mémoire (RDMA). Le RDMA augmente le débit, et fournit une faible latence et une faible utilisation du processeur.
  • SMB Multichannel – cette fonction permet aux serveurs de fichiers d'utiliser plusieurs connexions réseau simultanément et fournit un débit élevé.
  • SMB Scale-out – cette fonction permet à SMB 3.0 dans les configurations de clusters d'afficher un partage dans tous les nœuds d'un cluster dans une configuration actif/actif. Cela garantit que la bande passante de partage maximale est la bande passante totale de tous les nœuds de clusters de serveur de fichiers.

Pour les clients SMB, utilisez la fonction multithread robocopy pour copier des fichiers et des dossiers vers le serveur de fichiers via plusieurs connexions parallèles.

Vous pouvez également utiliser les fonctionnalités ECN (Explicit Congestion Notification) et LSO (Large Send Offload) pour réduire le débit.

Vérifier la perte de paquets sur la connexion Direct Connect

La perte de paquets se produit lorsque les paquets de données transmis n'arrivent pas à destination, ce qui entraîne des problèmes de performances réseau. La perte de paquets est causée par une faible puissance du signal à destination, une utilisation excessive du système, une congestion du réseau et des erreurs de configuration des acheminements réseau.

Pour plus d'informations, voir Comment puis-je résoudre les problèmes de perte de paquets pour ma connexion Direct Connect ?

Isoler et diagnostiquer les problèmes de performances réseau et d'applications

Vous pouvez utiliser des utilitaires tels que iPerf3, tcpdump et Wireshark pour résoudre les problèmes de performances de Direct Connect et analyser les résultats du réseau. Prenez note des paramètres suivants, qui affectent le débit réseau sur un seul flux TCP :

  • Taille de la fenêtre du récepteur (RWS) – indique le nombre maximum d'octets que le récepteur peut accepter sans causer le débordement des mémoires tampons.
  • Les expéditeurs envoient des mémoires tampons – cela peut limiter le nombre maximum d'octets dont le récepteur peut accuser réception. L'expéditeur ne peut pas ignorer les octets non reconnus tant qu'il n'a pas reçu d'accusé de réception. Les octets non reconnus peuvent devoir être retransmis après un délai d'expiration.
  • Les expéditeurs MSS (Maximum Segment Size) – le nombre maximum d'octets qu'un segment TCP peut avoir en tant que charge utile. Plus le MSS est petit, moins le débit du réseau est important.
  • Le temps aller-retour (RTT) – plus le RTT est élevé entre l'expéditeur et le récepteur, plus la bande passante réseau disponible est faible.

Conseil : il est recommandé que l'expéditeur initie plusieurs connexions parallèles au destinataire lors des transferts de fichiers.

Pour plus d'informations, voir Comment puis-je résoudre les problèmes de performances réseau Direct Connect ?


Cet article vous a-t-il été utile ?


Besoin d'aide pour une question technique ou de facturation ?