Lorsque j'utilise Amazon EMR pour modifier ou déplacer des données dans ou hors d'Amazon Simple Storage Service (Amazon S3), plusieurs fichiers vierges comportant le suffixe « _$folder$ » apparaissent dans mes compartiments S3. Que sont ces fichiers, et puis-je les supprimer sans risque ?
Résolution
Les fichiers « _ $ folder $ » constituent des espaces réservés. Apache Hadoop les génère lorsque vous utilisez la commande -mkdir pour créer un dossier dans un compartiment S3. Ce même dossier n'est pas généré tant que vous n'avez pas AJOUTÉ le premier objet. Si vous supprimez les fichiers « _ $ folder $ » avant d'effectuer cette opération avec au moins un objet, le dossier ne peut pas être généré. Ceci entraîne l'affichage du message d'erreur « No such file or directory » (Aucun fichier ou répertoire de ce nom n'existe).
En général, il est recommandé de ne pas supprimer les fichiers comportant le suffixe « _$folder$ ». En effet, des problèmes de performances peuvent ensuite se produire avec la tâche Amazon EMR, sauf si vous supprimez manuellement le dossier d'Amazon S3, puis tentez de le recréer dans une tâche Amazon EMR ou à l'aide de commandes Hadoop. Si vous ne supprimez pas les fichiers comportant le suffixe « _$folder$ » avant d'effectuer cette dernière opération, le message d'erreur « File exists » (Le fichier existe) s'affiche.
Informations connexes
Importation de données dans Amazon S3
Configuration d'un emplacement de sortie