Quand j'utilise Amazon EMR pour transformer des données ou pour les transférer depuis ou vers Amazon S3, plusieurs fichiers vides avec le suffixe «  _$folder$ » apparaissent dans mes compartiments S3. Que sont ces fichiers, et puis-je les supprimer sans risque ?

Amazon EMR est un service Web qui utilise une structure Hadoop gérée pour interagir avec les données, les traiter et les distribuer dans des magasins de données AWS, y compris Amazon S3. Comme S3 utilise un système de stockage à paire clé-valeur, le système de fichiers Hadoop crée des fichiers vides avec le suffixe «  _$folder$ » pour implémenter la prise en charge du répertoire dans S3.

Remarque : ce comportement n'a lieu que lorsque le système de fichiers Amazon EMR (EMRFS) essaie de créer un dossier avec un préfixe s3:// ou s3n://.

Vous pouvez supprimer sans risque tous les fichiers vides présentant le suffixe «  _$folder$ » dans les compartiments S3. Ils sont créés par la structure Hadoop lors de l'exécution, mais leur suppression n'empêche pas le traitement des données.

Remarque : si vous ne supprimez pas les fichiers génériques avec le suffixe «  _$folder$ », Hadoop génère une erreur « Le fichier existe déjà » lors de l'exécution d'une tâche vers le dossier de destination EMRFS d'origine avec un préfixe s3:// ou s3n://. Si vous exécutez la même tâche vers un dossier de destination EMRFS différent avec un préfixe s3:// ou s3n://, vous ne recevez pas d'erreur « Le fichier existe déjà », mais le nouveau dossier de destination comprend des fichiers génériques vides.


Cette page vous a-t-elle été utile ? Oui | Non

Retour au Centre de connaissances AWS Support

Vous avez besoin d'aide ? Consultez le site du Centre AWS Support

Date de publication : 29/04/2016

Date de mise à jour : 10/4/2018