在使用 Amazon EMR 将数据转换或移动到 Amazon S3 中或者从 Amazon S3 中将数据转换出或移出时,后缀为“ _$folder$”的几个空文件出现在 S3 存储桶中。这些文件是什么?能否安全地将其删除?

Amazon EMR 是一种 Web 服务,它使用 Hadoop 托管框架来处理和分配 AWS 数据存储 (包括 Amazon S3) 中的数据并与这些数据进行交互。由于 S3 采用键值对存储系统,Hadoop 文件系统通过创建后缀为“ _$folder$”的空文件在 S3 中实现目录支持。

注意:仅当 Amazon EMR File System (EMRFS) 尝试创建前缀为 s3://s3n:// 的文件夹时,才会出现上述行为。

您可以安全地删除 S3 存储桶中出现的后缀为“ _$folder$”的任何空文件。这些空文件是由 Hadoop 框架在运行时创建的,但是,即使这些空文件被删除,Hadoop 也可以处理数据。

注意:如果您不删除后缀为“ _$folder$”的占位符文件,Hadoop 在将作业运行到前缀为 s3://s3n:// 的原始 EMRFS 目标文件夹时,将会生成错误“File exists”(文件存在)。如果将相同的作业运行到前缀为 s3://s3n:// 的其他 EMRFS 目标文件夹,则您不会收到错误“File Exists”(文件存在),但新的目标文件夹将包含空占位符文件。


此页面对您有帮助吗? |

返回 AWS Support 知识中心

需要帮助? 请访问 AWS 支持中心

发布时间:2016 年 4 月 29 日

更新时间:2018 年 4 月 10 日