Preguntas frecuentes sobre Amazon EFS

Aspectos generales

Amazon Elastic File System (EFS) está diseñado para proporcionar un almacenamiento de archivos totalmente elástico y sin servidor que le permite compartir datos de archivos sin necesidad de aprovisionar o administrar la capacidad de almacenamiento y el desempeño. Con unas pocas selecciones en la Consola de administración de AWS, puede crear sistemas de archivos a los que puedan acceder las instancias de Amazon Elastic Compute Cloud (EC2), los servicios de contenedores de Amazon (Amazon Elastic Container Service [ECS], Amazon Elastic Kubernetes Service [EKS] y AWS Fargate) y las funciones de AWS Lambdaa través de una interfaz de sistema de archivos (con las API de E/S de archivos estándar del sistema operativo). También admiten semántica de acceso al sistema de archivos completa, como la coherencia sólida y el bloqueo de archivos.

Los sistemas de archivos de Amazon EFS pueden escalarse automáticamente desde gigabytes hasta petabytes de datos sin necesidad de aprovisionar almacenamiento. Decenas, cientos y hasta miles de instancias informáticas pueden acceder simultáneamente a un sistema de archivos de Amazon EFS que proporciona un rendimiento consistente a cada una de estas instancias. Amazon EFS está diseñado para ofrecer alta disponibilidad y durabilidad. Amazon EFS carece de tarifas mínimas o costos de contratación: paga únicamente por lo que consume.

Amazon EFS proporciona rendimiento para un amplio espectro de cargas de trabajo y aplicaciones: macrodatos y análisis, flujos de trabajo de procesamiento de medios, administración de contenido, servicio web y directorios domésticos.

Las clases de almacenamiento estándar de Amazon EFS son ideales para cargas de trabajo que requieren los más altos niveles de durabilidad y disponibilidad.

Las clases de almacenamiento EFS One Zone son ideales para cargas de trabajo como los entornos de desarrollo, creación y preparación. También son ideales para el análisis, la simulación y la transcodificación de medios, así como para las copias de seguridad o las réplicas de datos locales que no requieren una capacidad de recuperación Multi-AZ.

AWS ofrece servicios de almacenamiento en la nube para una amplia gama de cargas de trabajo de almacenamiento.

EFS es un servicio de almacenamiento de archivos que se utiliza con la computación de Amazon (EC2, contenedores, sin servidor) y los servidores locales. EFS proporciona una interfaz de sistema de archivos, semántica de acceso a dicho sistema (como coherencia sólida y bloqueo de archivos) y almacenamiento accesible de forma simultánea para miles de instancias de EC2.

Amazon EBS es un servicio de almacenamiento por bloques que se utiliza con EC2. EBS puede ofrecer rendimiento para las cargas de trabajo que requieren el acceso de menor latencia a los datos desde una única instancia de EC2.

Amazon S3 es un servicio de almacenamiento de objetos. S3 pone los datos a disposición a través de una API de Internet a la que se puede acceder desde cualquier lugar.

Obtenga más información acerca de qué evaluar al momento de considerar el uso de Amazon EFS.

Consulte Productos y servicios regionales para obtener detalles sobre la disponibilidad por región del servicio Amazon EFS.

Para utilizar Amazon EFS, debe disponer de una cuenta de AWS. Si aún no tiene una cuenta de AWS, puede registrarse para obtener una y acceder al instante al nivel gratuito de AWS.

Una vez que cree la cuenta de AWS, consulte la guía de Introducción de Amazon EFS para comenzar a utilizar el servicio. Puede crear un sistema de archivos a través de la consola, la interfaz de línea de comandos (CLI) de AWS y la API de EFS (así como varios SDK específicos de cada idioma).

Para acceder a su sistema de archivos, móntelo en una instancia EC2 basada en Linux mediante el comando de montaje estándar de Linux y el nombre DNS del sistema de archivos. Para simplificar el acceso a los sistemas de archivos de Amazon EFS, se recomienda usar la utilidad auxiliar de montaje de Amazon EFS. Una vez montado, puede trabajar con los archivos y directorios del sistema como lo haría con cualquier sistema de archivos local.

EFS usa la versión 4 del protocolo Network File System (NFS v4). Para obtener un ejemplo paso a paso de cómo acceder a un sistema de archivos desde una instancia de EC2, consulte la guía aquí.

Amazon EFS es un servicio completamente administrado, por lo que usted administra toda la infraestructura de almacenamiento de archivos. Cuando utiliza Amazon EFS, se evita las complicaciones de implementar y mantener la compleja infraestructura de un sistema de archivos. Un sistema de archivos de Amazon EFS crece y se reduce automáticamente a medida que se agregan y eliminan archivos, por lo que no es necesario administrar la adquisición o el aprovisionamiento de almacenamiento.

Puedes administrar un sistema de archivos a través de la consola, la CLI o la API de EFS (y varios SDK específicos de cada idioma). La consola, la API y el SDK permiten crear y eliminar sistemas de archivos, configurar el acceso a estos, crear y editar etiquetas del sistema de archivos, habilitar características, como el rendimiento aprovisionado y la administración del ciclo de vida, y mostrar información detallada sobre los sistemas de archivos.  

AWS DataSync ofrece una manera rápida de sincronizar con seguridad los sistemas de archivos existentes con Amazon EFS. DataSync funciona sobre cualquier conexión de red, incluida la de AWS Direct Connect o AWS VPN. EFS, DataSync y Direct Connect sin Amazon o AWS. También puede usar herramientas de copiado estándar de Linux para migrar archivos de datos a Amazon EFS.

Para obtener más información acerca de cómo acceder a un sistema de archivos desde un servidor local, consulte la sección Acceso local de estas preguntas frecuentes.

Para obtener más información acerca de la migración de datos a la nube de Amazon, consulte la página Migración de datos a la nube.

Escala y rendimiento

Con Amazon EFS puede almacenar petabytes de datos. Los sistemas de archivos de Amazon EFS son elásticos pues crecen y se reducen de forma automática a medida que se agregan y eliminan archivos. No es necesario aprovisionar el tamaño del sistema de archivos por adelantado, y solo se paga por lo que se utiliza.

Amazon EFS admite de una a miles de instancias de Amazon Elastic Compute Cloud (EC2) que se conectan a un sistema de archivos de forma simultánea.

Consulte la página de límites de Amazon EFS para obtener más información sobre dichos límites.

El rendimiento esperado para su sistema de archivos de Amazon EFS depende de su configuración específica (por ejemplo, la clase de almacenamiento y el modo de rendimiento) y el tipo de operación específica del sistema de archivos (lectura o escritura). Consulte la documentación sobre el desempeño del sistema de archivos para obtener más información sobre la latencia esperada, el rendimiento máximo y el desempeño máximo de IOPS para los sistemas de archivos de Amazon EFS.

El rendimiento elástico es el modo de rendimiento predeterminado y es adecuado para la mayoría de las cargas de trabajo de archivos. Con el modo de rendimiento elástico predeterminado, el rendimiento se escala automáticamente en función de la actividad de la carga de trabajo y solo paga por el rendimiento que usa (datos que se transfieren a sus sistemas de archivos al mes). El rendimiento elástico es perfecto si tiene dudas sobre las necesidades de rendimiento máximo de su aplicación, o si su aplicación es muy dinámica, con una actividad básica baja (que utiliza menos del 5 % de la capacidad de media cuando se aprovisiona para las necesidades máximas).

De forma opcional puede cambiar su modo de rendimiento a rendimiento aprovisionado si conoce los requisitos de rendimiento máximo de su carga de trabajo y espera que esta consuma una parte mayor (más del 5 % de media) de la capacidad de rendimiento máximo de su aplicación.

La cantidad de rendimiento que puede ofrecer depende del modo de rendimiento que elija. Para obtener más información, consulte la documentación sobre el rendimiento del sistema de archivos.  Visite la página de rendimiento del sistema de archivos para obtener más información.

Puede supervisar su sistema de archivos mediante Amazon CloudWatch o desde la pestaña Supervisión de la consola Amazon EFS. Consulte la documentación sobre la supervisión de Amazon EFS para obtener más información.

Durabilidad y disponibilidad

Amazon EFS ofrece dos tipos de sistemas de archivos entre los que puede elegir en función de sus necesidades de durabilidad y disponibilidad. Los sistemas de archivos EFS Regional (recomendados) ofrecen los niveles más altos de durabilidad y disponibilidad al almacenar datos en varias zonas de disponibilidad (AZ) y entre ellas. Los sistemas de archivos EFS One Zone almacenan los datos de forma redundante en una única AZ, por lo que los datos de estos sistemas de archivos no estarán disponibles y podrían perderse durante un desastre u otro error en la AZ.

Amazon EFS tiene un diseño que proporciona un 99,999999999 % (11 nueves) de durabilidad durante un año determinado. Los sistemas de archivos regionales de EFS están diseñados para mantener los datos en caso de pérdida de una AZ. Dado que los sistemas de archivos de EFS One Zone almacenan datos en una única AZ, los datos almacenados en estas clases de almacenamiento podrían perderse durante un desastre u otro fallo dentro de la AZ.  

Como en cualquier entorno, la práctica recomendada es tener una copia de seguridad, y establecer protecciones contra la eliminación accidental. En el caso de los datos de Amazon EFS, la práctica recomendada incluye replicar el sistema de archivos entre regiones mediante Amazon EFS Replication y una copia de seguridad funcional y probada periódicamente, mediante AWS Backup. Los sistemas de archivos que utilizan las clases de almacenamiento EFS One Zone están configurados para realizar copias de seguridad automáticas de los archivos de forma predeterminada en la creación del sistema de archivos.

Cada objeto del sistema de archivos regional de EFS (es decir, cada directorio, archivo y enlace) se almacena de manera redundante en varias zonas de disponibilidad. Con los sistemas de archivos EFS One Zone, sus datos se almacenan de forma redundante en una única AZ. Amazon EFS se diseñó para soportar errores concurrentes de dispositivos por medio de la detección y reparación rápida de cualquier redundancia perdida.  

Se accede a los datos del sistema de archivos EFS mediante destinos de montaje EFS específicos de una AZ, que están diseñados para ofrecer una alta disponibilidad en una AZ. Los sistemas de archivos EFS Regional admiten el acceso simultáneo desde los destinos de montaje de EFS en todas las AZ de la región en la que se encuentran. Esto significa que puede diseñar su aplicación para que se conmute por error de una AZ a otras AZ de la región para lograr el máximo nivel de disponibilidad de la aplicación. Los sistemas de archivos EFS One Zone solo admiten un destino de montaje EFS de alta disponibilidad en una única AZ, lo que significa que los datos pueden dejar de estar disponibles durante un desastre u otro error dentro de esa AZ. Para obtener más información sobre la disponibilidad, consulte el Acuerdo de nivel de servicios de Amazon EFS.

Los sistemas de archivos EFS One Zone no son resistentes a una interrupción completa de AZ. Durante una interrupción de la AZ, experimentará una pérdida de disponibilidad, porque los datos de su sistema de archivos no se replican a una AZ diferente. Durante un desastre o fallo dentro de una AZ que afecte a todas las copias de sus datos, podría experimentar la pérdida de datos que no se hayan protegido con copias de seguridad de EFS o EFS Replication. Las copias de seguridad de EFS están habilitadas de forma predeterminada para todos los sistemas de archivos EFS One Zone.

Clases de almacenamiento y administración del ciclo de vida

Amazon EFS ofrece tres clases de almacenamiento: EFS Standard, EFS Infrequent Access y EFS Archive. Los datos a los que se accede con frecuencia tienden a tener necesidades de rendimiento más altas, por lo que EFS proporciona una clase EFS Standard con tecnología SSD diseñada para ofrecer latencias inferiores a milisegundos. Para los datos a los que se accede con poca frecuencia, puede usar las dos clases de almacenamiento de EFS con costos optimizados que proporcionan latencias bajas de milisegundos de dos dígitos: EFS Infrequent Access (IA), diseñada para los datos a los que se accede solo unas pocas veces por trimestre, y EFS Archive, diseñada para los datos a los que se accede varias veces al año o menos. EFS IA ofrece un costo hasta un 95 % más bajo que EFS Standard para los datos a los que se accede con poca frecuencia. Al proporcionar una experiencia más rentable para datos aún más fríos, EFS Archive ofrece un costo hasta un 50 % más bajo que EFS Infrequent Access, con un cargo de solicitud más alto cuando se accede a esos datos. EFS Archive está optimizada y es compatible con los sistemas de archivos regionales de EFS mediante el modo de rendimiento elástico predeterminado de EFS. Consulte las clases de almacenamiento de EFS y los precios de EFS para obtener más información.

Al habilitar la administración del ciclo de vida de EFS, puede organizar automáticamente los archivos entre clases de almacenamiento en función de sus patrones de acceso. La política de ciclo de vida recomendada predeterminada clasificará los archivos de EFS Standard como EFS IA después de 30 días consecutivos sin acceso y como EFS Archive después de 90 días consecutivos sin acceso. También puede especificar una política personalizada para la transición de archivos entre clases de almacenamiento en función del número de días transcurridos desde el último acceso de un archivo.

También puede habilitar EFS Intelligent-Tiering para devolver los archivos de EFS IA y EFS Archive a EFS Standard cuando se accede a ellos, lo que proporciona lecturas posteriores de esos archivos con las latencias inferiores a un milisegundo más rápidas de EFS Standard. Una vez transferidos, estos archivos volverán a la clase de almacenamiento IA o Archive correspondiente según su política de ciclo de vida.

En comparación con la clase EFS Standard, EFS IA y Archive ofrecen el mismo rendimiento y escalabilidad de IOPS, pero con latencias de primer byte más altas (es decir, latencias de lectura de milisegundos bajas de dos dígitos frente a latencias de lectura inferiores a un milisegundo en EFS Standard). Para más información, consulte la documentación sobre el rendimiento de Amazon EFS.

EFS IA no tiene duración mínima del almacenamiento. Los datos que se almacenan en niveles en EFS Archive tienen una duración mínima de almacenamiento de 90 días. Los archivos eliminados o truncados antes de la duración mínima incurrirán en un cargo prorrateado durante los días restantes, en función del tamaño del archivo antes de la acción correspondiente.

Las clases de almacenamiento de EFS con costos optimizados (IA, Archive) están diseñadas para almacenar datos más fríos e inactivos, que normalmente se componen de archivos más grandes. No hay un tamaño mínimo de archivo para IA o Archive, pero los archivos agrupados en estas clases de almacenamiento que tengan un tamaño inferior a 128 KB incurrirán en cargos de almacenamiento como si fueran de 128 KB.

Protección de datos

Amazon EFS Replication copia los datos del sistema de archivos en un sistema de archivos nuevo o existente de la región que elija. Mantiene los dos sistemas de archivos sincronizados, al transferir de manera automática solo los cambios incrementales sin requerir infraestructura adicional ni un proceso personalizado. EFS Replication está diseñado para proporcionar un objetivo de punto de recuperación (RPO) y un objetivo de tiempo de recuperación (RTO) de minutos, lo que le permite cumplir con sus objetivos de conformidad y continuidad empresarial.

Debe usar EFS Replication para mantener una réplica de su sistema de archivos a muchos kilómetros de distancia para la recuperación de desastres, el cumplimiento o la planificación de la continuidad empresarial. En caso de desastre, puede realizar una conmutación por error a su sistema de archivos de réplica y reanudar las operaciones de sus aplicaciones críticas para la empresa en cuestión de minutos. Una vez finalizado el evento de desastre, puede realizar la conmutación por recuperación y transferir únicamente los cambios incrementales de la réplica al sistema de archivos original. Mientras EFS Replication esté habilitado, sus aplicaciones pueden usar el sistema de archivos de réplica en modo de solo lectura para un acceso entre regiones con baja latencia de red. Con Amazon EFS Replication, puede configurar su sistema de archivos de réplica de forma independiente del sistema de archivos original para usar clases de almacenamiento optimizadas en cuanto a costos y una política de administración del ciclo de vida útil más corta para ahorrar hasta un 92 % en sus costos. EFS Replication también agiliza el monitoreo y la alarma del estado de su RPO mediante Amazon CloudWatch.

No. EFS Replication no ofrece la replicación coherente con un momento dado. EFS Replication publica una métrica de marca de tiempo en Amazon CloudWatch denominada TimeSinceLastSync. Todos los cambios realizados en el sistema de archivos de origen al menos hasta la hora de publicación se copiarán en la réplica. Es posible que los cambios realizados en el sistema de archivos de origen después del tiempo registrado no se hayan replicado. Puede supervisar el estado de EFS Replication mediante Amazon CloudWatch. Si se interrumpe el proceso de replicación debido a un evento de recuperación de desastres, es posible que los archivos del sistema de archivos de origen se transfieran pero aún no se copien a sus ubicaciones finales. Estos archivos y su contenido pueden encontrarse en su sistema de archivos de réplica en un directorio lost+found creado por EFS Replication bajo el directorio raíz.

Amazon EFS Backup se basa en AWS Backup, un servicio de copia de seguridad totalmente administrado que administra y automatiza de forma centralizada las copias de seguridad de sus sistemas de archivos de Amazon EFS. Protege su sistema de archivos contra un evento de pérdida de datos al hacer copias incrementales de su sistema de archivos en una ubicación centralizada de forma automática y programada. Con AWS Backup, se proporciona una consola centralizada, programación automatizada, administración de la retención de copias de seguridad, además de actividad de restauración. Para obtener más información, consulte la documentación de AWS Backup o las preguntas frecuentes.

Amazon EFS está integrado de forma nativa con AWS Backup. Puede usar la consola de EFS, la API y la interfaz de la línea de comandos de AWS (AWS CLI) para habilitar las copias de seguridad automáticas, que utilizan un plan de copias de seguridad predeterminado con la configuración recomendada de AWS Backup. Durante la copia de seguridad inicial, se hace una copia de todo el sistema de archivos en el almacén de copias de seguridad. Todas las copias de seguridad posteriores de ese sistema de archivos son de naturaleza incremental, es decir, solo se copian los archivos y directorios que se han modificado, agregado o eliminado. Con cada copia de seguridad incremental, AWS Backup conserva los datos de referencia necesarios para permitir una restauración completa. En caso de pérdida de datos, puede realizar una restauración total o parcial del sistema de archivos mediante la consola de AWS Backup o la CLI.   

Seguridad

Está en sus manos controlar qué instancias de EC2 pueden acceder a su sistema de archivos por medio de las reglas del grupo de seguridad de la VPC y las políticas de IAM. Use grupos de seguridad de la VPC para controlar el tráfico de red hacia y desde su sistema de archivos. Adjunte una política IAM a su sistema de archivos para controlar qué clientes pueden montar su sistema de archivos y con qué permisos, y utilice puntos de acceso EFS para manejar el acceso a la aplicación. Puede controlar el acceso a los archivos y directorios mediante permisos en los niveles de usuario o grupo compatibles con POSIX.

Usando la consola de Amazon EFS, puede aplicar políticas comunes al sistema de archivos, como deshabilitar el acceso raíz, forzar el acceso de solo lectura o hacer que todas las conexiones a su sistema de archivos estén cifradas. También puede aplicar políticas más avanzadas, como otorgar acceso a roles de IAM específicos, incluidos los de otras cuentas de AWS.

 

Un punto de acceso EFS es un punto de conexión de red que los usuarios y las aplicaciones pueden utilizar para acceder a un sistema de archivos EFS y aplicar los permisos de nivel de archivo y carpeta (POSIX) basados en el control de acceso de grano fino y los permisos basados en políticas definidos en IAM.

Los puntos de acceso de EFS ofrecen la flexibilidad necesaria para crear y administrar entornos multiusuario para sus aplicaciones de archivos de forma nativa en la nube, lo que le permite simplificar el intercambio de datos. A diferencia de las ACL tradicionales de POSIX para controlar el acceso al sistema de archivos, o de Kerberos para controlar la autenticación, que requieren una configuración, administración y mantenimiento complejos, y que a menudo introducen riesgos, los puntos de acceso de EFS se integran con IAM para permitir que las aplicaciones nativas de la nube utilicen el almacenamiento de archivos compartido basado en POSIX. Los casos de uso que pueden beneficiarse de los puntos de acceso de Amazon EFS incluyen entornos basados en contenedores en los que los desarrolladores crean e implementan sus propios contenedores, aplicaciones de ciencia de datos que requieren acceso a los datos de producción y compartir un directorio específico en su sistema de archivos con otras cuentas de AWS.

Cuando crea un punto de acceso de Amazon EFS, puede configurar un usuario y un grupo del sistema operativo, así como un directorio raíz para todas las conexiones que lo utilizan. Si especifica el propietario del directorio raíz, EFS lo creará automáticamente con los permisos que provea la primera vez que un cliente se conecte al punto de acceso. También puede actualizar la política IAM de su sistema de archivo para así afectar a todos los puntos de acceso. Por ejemplo, puede aplicar una política que requiera una identidad de IAM específica para poder conectarse a un punto de acceso en concreto. Para obtener más información, consulte la guía del usuario de Amazon EFS.

Amazon EFS permite cifrar datos en reposo y en tránsito.

Los datos en reposo se cifran de manera transparente mientras se escriben, y se descifran de la misma manera mientras se leen, por lo que no tiene que modificar sus aplicaciones. AWS KMS administra las claves de cifrado, lo que elimina la necesidad de crear y mantener una infraestructura de administración de claves segura.

El cifrado de datos en tránsito usa el estándar de la industria Seguridad de la capa de transporte (TLS) 1.2 para cifrar los datos enviados entre sus clientes y los sistemas de archivos de EFS.

El cifrado de datos en reposo y en tránsito se puede configurar de manera conjunta o individual para permitirle cumplir sus requisitos de seguridad específicos.

Para obtener más detalles, consulte la documentación del usuario sobre el cifrado.

AWS KMS es un servicio administrado que facilita la creación y el control de las claves de cifrado que se utilizan para cifrar sus datos. AWS KMS está integrado con los servicios de AWS, como EFS, EBS y S3, lo que simplifica el cifrado de sus datos con claves de cifrado que usted administra. Además, AWS KMS está integrado en AWS CloudTrail para ofrecer los registros de uso de todas las claves a fin de que se ajusten a sus necesidades vinculadas con asuntos normativos y de conformidad.

Puede habilitar el cifrado en reposo en la consola de EFS mediante la CLI o los SDK. Al crear un nuevo sistema de archivos en la consola de EFS, seleccione Create File System (Crear sistema de archivos) y, a continuación, marque la casilla para habilitar el cifrado.

Los datos pueden cifrarse en tránsito entre su sistema de archivos de Amazon EFS y sus clientes mediante el asistente de montaje de Amazon EFS.

El cifrado de datos en reposo y en tránsito se puede configurar de manera conjunta o individual para permitirle cumplir sus requisitos de seguridad específicos.

Para obtener más detalles, consulte la documentación del usuario sobre el cifrado.

El cifrado de los datos ejerce un efecto mínimo en el rendimiento y la latencia de E/S.

Acceso en las instalaciones

Cambie a Para acceder a los sistemas de archivos EFS desde las instalaciones, debe tener una conexión Direct Connect o AWS VPN entre su centro de datos local y su nube virtual privada (VPC) de Amazon.

Puede montar un sistema de archivos de Amazon EFS en su servidor Linux local mediante el comando de montaje de Linux estándar para montar un sistema de archivos a través del protocolo NFS v4.1.

Para más información sobre cómo acceder a los sistemas de archivos de Amazon EFS desde servidores locales, consulte la documentación.

Puede montar los sistemas de archivos de Amazon EFS en sus servidores locales y transferir los datos de archivos desde y hacia Amazon EFS con herramientas y secuencias de comandos de Linux estándar o con AWS DataSync. La capacidad de transferir datos de archivos desde y hacia sistemas de archivos de Amazon EFS posibilita tres casos de uso.

En primer lugar, puede migrar datos de centros locales para que residan permanentemente en sistemas de archivos de EFS.

En segundo lugar, puede respaldar cargas de trabajo con ampliación en la nube para descargar el procesamiento de aplicaciones a la nube. Puede trasladar los datos de sus servidores locales a sus sistemas de archivos de Amazon EFS, analizarlos en un clúster de instancias EC2 en su VPC de Amazon y almacenar los resultados de forma permanente en sus sistemas de archivos de Amazon EFS o trasladar los resultados de nuevo a sus servidores locales.

En tercer lugar, puede copiar periódicamente los datos de sus archivos locales en Amazon EFS para admitir copias de seguridad y recuperación de desastres.

Sí. Puede acceder a su sistema de archivos de Amazon EFS de forma simultánea desde los servidores de su centro de datos local, así como desde las instancias EC2 de su VPC de Amazon. Amazon EFS proporciona la misma semántica de acceso a sistemas de archivos, como la excelente uniformidad de los datos y el bloqueo de archivos, en todas las instancias de EC2 y servidores on-premise que accedan a un sistema de archivos.

Existen diferentes métodos para copiar datos locales existentes a Amazon EFS. AWS DataSync ofrece una manera rápida y simple de sincronizar de manera segura sistemas de archivos existentes con EFS, y funciona sobre cualquier red, incluida AWS Direct Connect

AWS Direct Connect ofrece una conexión de red exclusiva con ancho de banda alto y baja latencia sobre la cual puede montar los sistemas de archivos de EFS. Una vez montados, puede usar DataSync para copiar datos en EFS a una velocidad hasta 10 veces superior a la de las herramientas estándares de copiado de Linux.

Para obtener más información sobre AWS DataSync, consulte la sección Transferencia de datos de estas preguntas frecuentes.

Transferencia de datos

DataSync es un servicio de transferencia de datos en línea que agiliza y simplifica el traslado de datos entre el almacenamiento local y Amazon EFS. DataSync utiliza un protocolo especialmente diseñado para acelerar y asegurar la transferencia a través de Internet o Direct Connect, a velocidades hasta 10 veces más rápidas que las herramientas de código abierto. Con DataSync, puede realizar migraciones de datos de una sola vez, transferir datos locales para un análisis oportuno en la nube y automatizar la replicación en AWS para la protección y recuperación de datos.

AWS Transfer Family es un servicio de transferencia de archivos completamente administrado que brinda soporte para el Protocolo de transferencia segura de archivos (SFTP), el Protocolo de transferencia de archivos sobre SSL (FTPS) y el Protocolo de transferencia de archivos (FTP). AWS Transfer Family le proporciona un servicio de transferencia de archivos de alta disponibilidad y completamente administrado con capacidades de escalado automático, lo que elimina la necesidad de administrar la infraestructura relacionada con la transferencia de archivos. Los flujos de trabajo de los usuarios finales permanecen sin cambios, mientras que los datos cargados y descargados a través de los protocolos seleccionados se almacenan en su sistema de archivos de Amazon EFS.

Para empezar a utilizar DataSync, puede emplear la consola o la CLI para conectar el agente a sus sistemas de archivos locales o en la nube mediante el protocolo Network File System (NFS), seleccionar su sistema de archivos de Amazon EFS y empezar a copiar datos. Primero debe desplegar un agente de software que esté disponible para su descarga desde la consola, excepto cuando se copien archivos entre dos sistemas de archivos de Amazon EFS.

Para comenzar con AWS Transfer Family, primero asegúrese de que los usuarios de POSIX que planea asignar a AWS Transfer puedan acceder a los directorios de su sistema de archivos. Después, puede utilizar la consola, la CLI o la API para crear un punto de enlace y usuarios de AWS Transfer Family. Una vez completado, los usuarios finales pueden usar sus clientes SFTP, FTP o FTPS para acceder a los datos almacenados en el sistema de archivos de Amazon EFS.

Puede utilizar DataSync para transferir archivos entre dos sistemas de archivos de Amazon EFS, incluso en diferentes regiones de AWS. Los puntos de conexión de AWS Transfer Family deben estar en la misma región que su sistema de archivos de Amazon EFS.

Sí. Puede utilizar DataSync para copiar archivos a un sistema de archivos de Amazon EFS en otra cuenta de AWS.

También puede configurar su sistema de archivos de Amazon EFS para que AWS Transfer Family acceda a él con otra cuenta, siempre y cuando esta tenga permisos para hacerlo. Para obtener más información sobre cómo otorgar permisos de Transfer Family a cuentas de AWS externas a través de políticas del sistema de archivos, consulte la documentación.

Compatibilidad

EFS se integra con otros servicios de AWS, como CloudWatch, AWS CloudFormation, CloudTrail, IAM y los servicios de etiquetado de AWS.

CloudWatch le permite monitorear la actividad del sistema de archivos mediante métricas. CloudFormation ayuda a crear y administrar sistemas de archivos mediante plantillas.

CloudTrail permite registrar todas las llamadas a la API de EFS en archivos de registro.

IAM ayuda a controlar quién puede administrar su sistema de archivos. Los servicios de etiquetado de AWS permiten etiquetar los sistemas de archivos con los metadatos que usted defina.

Puede planificar y administrar los costos del sistema de archivos de Amazon EFS mediante AWS Budgets. Puede trabajar con AWS Budgets en la consola de Administración de facturación y costos de AWS. Para utilizar AWS Budgets, cree un presupuesto de costos mensual para los sistemas de archivos de Amazon EFS.

Amazon EFS sigue el protocolo NFS v4.1 para el bloqueo consultivo y permite a sus aplicaciones utilizar bloqueos de todo el archivo o de intervalos del tamaño de bytes.

Todo sistema de archivos dispone de un número identificador exclusivo generado automáticamente. Puede etiquetar el sistema de archivos con un nombre, que no tiene por qué ser exclusivo.

Precios y facturación

Con Amazon EFS, solo paga por el almacenamiento principal y de copia de seguridad que utilice y por la actividad de lectura, escritura y organización en niveles en su sistema de archivos EFS. Paga por el acceso de lectura y escritura con Rendimiento elástico (pero, de forma opcional, puede aprovisionar el rendimiento por adelantado con Rendimiento aprovisionado) y por organizar los datos en niveles en las clases de almacenamiento Infrequent Access y Archive.

Amazon EFS ofrece tres clases de almacenamiento: EFS estándar, que ofrece un rendimiento de latencia inferior a un milisegundo para los datos que se utilizan activamente; acceso poco frecuente de EFS (EFS IA), que optimiza los costos para los datos a los que se accede solo unas pocas veces por trimestre; y EFS Archive, que está optimizada para los datos de larga duración a los que se accede unas cuantas veces al año o menos.

EFS también ofrece protección de datos para sus archivos con EFS Backup y EFS Replication. Con EFS Backup, solo paga por la cantidad de almacenamiento de copia de seguridad que utilice y por la cantidad de datos que restaure al mes. No se aplica una tarifa mínima ni cargos de configuración. Visite AWS Backup para obtener más información. Utilice EFS Replication para replicar un sistema de archivos en una región o zona de disponibilidad (AZ) de su elección sin tener que administrar infraestructura adicional ni procesos personalizados.

Puede realizar una estimación de su factura mensual con la calculadora de precios de Amazon EFS.

No se requieren cargos de configuración ni compromisos para comenzar a utilizar Amazon EFS. A final de mes, se cobrará automáticamente el uso de ese mes. Puede ver los cargos del periodo de facturación actual en cualquier momento iniciando sesión en su cuenta de Amazon Web Services y seleccionando el panel de facturación asociado a su perfil de consola.

Con el nivel de uso gratuito de AWS, su uso del nivel gratuito se calcula mensualmente en todas las regiones de AWS, excepto en la región de AWS GovCloud, y se aplica a su factura de manera automática; no se acumulará el uso mensual no consumido hasta el próximo mes. Al registrarse, los nuevos clientes de EFS reciben 5 GB de Amazon EFS Standard cada mes durante un año. El nivel gratuito de AWS no aplica a los archivos almacenados en el tipo de sistema de archivos EFS One Zone. Se aplican restricciones; consulte las condiciones de la oferta para obtener más detalles.

Amazon EFS le cobra por los siguientes tipos de uso. Tenga en cuenta que los siguientes cálculos presuponen que no se está utilizando la capa gratuita de AWS.

Almacenamiento utilizado:

El importe de Amazon EFS facturado en un mes se basa en el uso del almacenamiento, el rendimiento y la protección de datos en un mes. Los costos de almacenamiento se calculan en función del espacio de almacenamiento promedio utilizado durante el mes. El uso del almacenamiento se mide en “GB por mes”, que se suman al final del mes para determinar los cargos mensuales. 

El siguiente ejemplo refleja una situación en la que sus patrones de acceso a los archivos cambian con el tiempo, e incluye cada una de las dimensiones de precios de EFS IA y EFS Archive. El ejemplo asume que las dos políticas del ciclo de vida de EFS para mover archivos entre EFS Standard, EFS Infrequent Access (IA) y EFS Archive están configuradas.

Supongamos que su sistema de archivos se encuentra en la región este de EE. UU. (Norte de Virginia). Al principio de un mes de 31 días, el sistema de archivos almacena 200 GB de archivos en EFS Standard, 500 GB de archivos en EFS IA y 2 TB de archivos en EFS Archive. El día 15 del mes, la administración de ciclo de vida EFS traslada el 50 % de los archivos de EFS Standard a la clase de almacenamiento EFS IA y el 10 % de los archivos de EFS IA a la clase EFS Archive después de 14 días de no haber accedido a ellos. Una vez al mes, 10 clientes diferentes leen 800 GB de archivos de su EFS IA y 100 GB de archivos de sus clases de EFS Archive.

Primero, calculamos el uso de almacenamiento prorrateado:

Almacenamiento Standard:
200 GB de almacenamiento EFS Standard durante 14 días (GB-horas): 200 GB x 14 días x (24 horas/día) = 67 200 GB-horas
100 GB de almacenamiento EFS Standard durante 17 días (GB-horas): 100 GB x 17 días x (24 horas/día) = 40 800 GB-horas
Uso total por almacenamiento EFS Standard (GB-horas): 67 200 GB-horas+ 40 800 GB-horas = 108 000 GB-horas

Almacenamiento IA:
500 GB de almacenamiento EFS IA durante 14 días (GB-horas): 500 GB x 14 días x (24 horas/día) = 168 000 GB-horas
100 GB de archivos de EFS Standard a EFS IA durante 17 días (GB-horas) = 100 GB x 17 x (24 horas/día) = 40 800 GB-horas
450 GB de EFS IA (después de transferir 50 GB a EFS Archive) = 450 GB x 17 x (24 horas al día) = 183 600 GB-horas

Uso total de EFS IA (GB-horas): 168 000 GB-horas+ 40 800 GB-horas + 326 400 GB-horas = 392 400 GB-horas

Almacenamiento de Archive:
2 TB de almacenamiento EFS IA durante 31 días (GB-horas): 1000 GB x 14 días x (24 horas/día) = 1 488 000 GB-horas
50 GB de archivos de EFS IA a EFS Archive durante 17 días (GB-horas): 50 GB x 17 x (24 horas/día) = 20 400 GB-horas
Uso de EFS Archive (GB-horas): 1 488 000 GB-horas + 20 400 GB-horas = 1 508 400 GB-horas

A continuación, convertimos el uso del almacenamiento en GB-meses y calculamos el cargo de almacenamiento:
Cargo total de EFS Standard: 108 000 GB-horas x (1 mes/744 horas) x 0,30 USD/GB-mes = 43,55 USD
Cargo total de almacenamiento de EFS IA: 392 400 GB-horas x (1 mes/744 horas) x 0,0165 USD/GB-mes = 8,70 USD
Cargo total de almacenamiento de EFS Archive: 1 508 400 GB-horas x (1 mes/744 horas) x 0,008 USD/GB-mes = 16,22 USD
Cargo total de almacenamiento de EFS: 43,55 USD + 8,70 USD + 16,22 USD = 68,47 USD

Luego, calculamos los cargos de acceso para los archivos en EFS IA y EFS Archive:

Niveles de datos de IA:
Niveles de datos (archivos transferidos de EFS Standard a EFS IA): 100 GB * 0,01 USD/GB = 1,00 USD
Transición del ciclo de vida a EFS Standard debido a la lectura de archivos en EFS IA: 800 GB * 0,01 USD/GB = 8.00 USD (una vez para 10 clientes)
Cargos totales de acceso a EFS IA: 1.00 USD + 8.00 USD = 9.00 USD

Niveles de datos de Archive:
Niveles de datos (archivos transferidos de Infrequent Access a Archive): 50 GB * 0,03 USD/GB = 1,50 USD
Transición del ciclo de vida a EFS IA debido a la lectura de archivos en EFS Archive: 100 GB * 0,06 USD por GB = 6,00 USD (una vez para 10 clientes)
Cargos totales de acceso a EFS IA: 1,50 USD + 6,00 USD = 7,50 USD
Cargos totales de acceso a EFS: 9,00 USD + 7,50 USD = 16,50 USD

Finalmente, calculamos el total de los cargos de EFS para el mes:

Cargos mensuales totales = Cargo total de almacenamiento + Cargo total de acceso = 68,47 USD + 16,50 USD = 84,97 USD (TCO - 0,0315 USD/GB)

Puede acceder a sus datos para realizar operaciones de lectura y escritura con rendimiento elástico. Con el rendimiento elástico, el rendimiento se escala automáticamente en función de la actividad de la carga de trabajo y solo paga por el rendimiento que usa (datos que se transfieren a sus sistemas de archivos al mes). El importe del rendimiento elástico facturado en un mes se basa en los datos de lectura y escritura transferidos en un mes y se mide en “GB transferidos”.

Puede usar el rendimiento elástico si conoce los requisitos de uso y rendimiento máximo de su aplicación. El importe de rendimiento aprovisionado facturado en un mes se basa en el rendimiento promedio aprovisionado que supere lo que permite EFS Standard para el mes, hasta los límites de rendimiento por ráfagas base vigentes en la región de AWS, y se mide en “MB/s-mes”.

Ejemplo de rendimiento elástico:

Supongamos que su sistema de archivos está ubicado en la región Este de EE. UU. (Norte de Virginia) y tiene 100 GB de almacenamiento EFS Standard durante un mes completo de 31 días. Suponga que la transferencia de datos de su carga de trabajo consiste en un 75 % de operaciones de lectura y un 25 % de operaciones de escritura, genera un rendimiento máximo de 100 MB/s durante 3 horas al día y 3 días a la semana y permanece inactiva el resto del tiempo.  

Cargo total mensual por rendimiento elástico

Si suponemos que todos los datos transferidos son al almacenamiento EFS Standard, al final del mes, tendría el siguiente uso en GB:

Total de datos de rendimiento elástico (GB) en el mes: 100 MB/s x (60 minutos x 60 segundos x 3 horas) x 3 días x 4 semanas/1000 = 12 960 GB 
Rendimiento elástico total de lectura de datos (GB): 75 % x 12 960 GB = 9720 GB
Rendimiento elástico total de datos de escritura (GB): 25 % x 12 960 GB = 3240 GB

A continuación, calculamos los cargos mensuales totales de rendimiento elástico: 

Cargos por datos de lectura del rendimiento elástico: 9720 GB x 0,03 USD/GB = 291,60 USD 
Cargos por datos de escritura del rendimiento elástico: 3240 GB x 0,06 USD/GB = 194,40 USD
A continuación, calculamos los cargos mensuales totales de rendimiento elástico:
Cargo mensual total por rendimiento elástico: 291,60 USD + 194,40 USD = 486,00 USD

Ejemplo de rendimiento aprovisionado:

Supongamos los mismos supuestos que en el ejemplo anterior de rendimiento elástico (su sistema de archivos está ubicado en la región Este de EE. UU. [Norte de Virginia] y tiene 100 GB de almacenamiento EFS Standard durante un mes completo de 31 días. Suponga que la transferencia de datos de su carga de trabajo consiste en un 75 % de operaciones de lectura y un 25 % de operaciones de escritura, genera un rendimiento máximo de 100 MB/s durante 3 horas al día y 3 días a la semana, y
permanece inactiva durante el resto del tiempo). La cantidad de rendimiento facturada en un mes se basa en el promedio de rendimiento aprovisionado en exceso de lo que su almacenamiento EFS Standard permite por mes (50 Kbps de rendimiento de referencia por 1 GB de almacenamiento Standard)

Rendimiento de referencia (MB/s mes) = 100 GB de almacenamiento estándar * 50 Kbps/1000 = 5 MB/s mes.
Rendimiento total aprovisionado facturable (MB/s al mes) = Rendimiento configurado –
Rendimiento de referencia = 100 MB/s-mes – 5 MB/s-mes = 95 MB/s-mes
Cargo total de rendimiento aprovisionado mensual = 95 MB/s-mes x 6 USD/Mb/s-mes = 570,00 USD

Si lo desea, puede usar EFS Replication o AWS Backup para proteger sus datos. Con EFS Replication, paga por el almacenamiento, los cargos de acceso de las clases de acceso Infrequent Access y Archive y los cambios en la transferencia de datos si su sistema de archivos de destino se encuentra en una región de AWS diferente. Con AWS Backup, paga por la cantidad promedio de datos respaldados y restaurados en un mes.

Replicación

Este ejemplo refleja un escenario en el que se replican sistemas de archivos entre regiones mediante EFS Replication. El ejemplo se centra en los costos directamente relacionados con EFS Replication.

Supongamos que tiene un sistema de archivos EFS en la región este de EE. UU. (Norte de Virginia) con 1 TB de datos. Este sistema de archivos se está replicando en la región Oeste de EE. UU. (Oregón). Suponga que el sistema de archivos de destino utiliza una política de administración del ciclo de vida de EFS de 7 días para transferir los archivos a otra clase de almacenamiento IA.

Cuando la replicación se activa por primera vez, todo el sistema de archivos de origen se copia en el sistema de archivos de destino. Los datos replicados primero aterrizarán en la clase EFS Standard en el sistema de almacenamiento de destino. Si no se accede a los archivos durante la vigencia de la política de administración del ciclo de vida de EFS (7 días), se transferirán a la clase EFS IA.

Sincronización inicial:

En primer lugar, calcule el almacenamiento prorrateado utilizado para el sistema de archivos de destino:
Uso total del almacenamiento EFS Standard (GB-horas): 1000 GB × 7 días × (24 horas/día) = 168 000 GB-horas
Uso total del almacenamiento EFS IA (GB-horas): 1000 GB × 24 días × (24 horas/día/31 días al mes) = 576 000 GB-horas

A continuación, convertimos el uso del almacenamiento en GB-meses y calculamos el cargo de almacenamiento para el sistema de archivos de destino:

Cargo total de EFS Standard: 168 000 × (1 mes/744 horas) × 0,30 USD/GB-mes = 67,74 USD
Cargo total de EFS IA: 576 000 * (1 mes/744 horas) * 0,025 USD por GB al mes = 19,36 USD
Total de cargos de almacenamiento para la sincronización inicial = 67,74 USD + 19,36 USD = 87,10 USD
Luego calculamos los cargos por transferencia de datos para la replicación inicial del sistema de archivos de origen al sistema de archivos de destino:
Total de cargos por transferencia de datos de EFS Replication para 1 TB de datos: 1000 GB × 0,02 USD/GB = 20,00 USD

Total de cargos para la sincronización inicial = Total de cargos de almacenamiento para la sincronización inicial + Total de cargos por transferencia de datos para la sincronización inicial = 87,10 USD + 20,00 USD = 107,10 USD

Replicación progresiva:

Imagine que el sistema de archivos de origen suma 150 GB de datos nuevos tras los 7 días. Los nuevos datos se replicarán en el sistema de archivos de destino y residirán en la clase EFS Standard durante 7 días, según la política de administración del ciclo de vida, al igual que antes. El uso de almacenamiento prorrateado de 150 GB de nuevos datos se calcula de la manera siguiente:

Uso total del almacenamiento EFS Standard (GB-horas): 150 GB × 7 días × (24 horas/día) = 25 200 GB-horas
Uso total del almacenamiento EFS IA (GB-horas): 150 GB × 17 días × (24 horas/día) = 61 200 GB-horas

A continuación, convertimos el uso del almacenamiento en GB-meses y calculamos el cargo de almacenamiento para los 150 GB de nuevos datos agregados al sistema de archivos de destino: 

Cargo total de almacenamiento EFS Standard: 25 200 GB-horas × (1 mes/744 horas) × 0,30 USD/GB-mes = 10,16 USD
Cargo total de EFS IA: 61 200 * (1 mes/744 horas) * 0,025 USD por GB al mes = 2,06 USD
Cargo total de almacenamiento para la replicación progresiva = 10,16 USD + 2,06 USD = 12,22 USD

Por último, calculamos los cargos por transferencia de datos para los 150 GB de datos progresivos:

Cargos totales de transferencia de datos para la replicación incremental: 150 GB * 0,02 USD/GB = 3,00 USD
Total de cargos de replicación progresiva = Total de cargos de almacenamiento para la replicación progresiva + Total de cargos por transferencia de datos para replicación progresiva = 12,22 USD + 3,00 USD = 15,22 USD

Total de cargos relacionados con EFS Replication = Total de cargos para la sincronización inicial + Total de cargos para replicación progresiva = 107,10 USD + 15,22 USD = 122,32 USD

Copia de seguridad

Consulte los precios de AWS Backup para ver ejemplos de precios de copia de seguridad.

Para más información sobre los precios de EFS, consulte la página de precios de Amazon EFS.

Si no se especifica lo contrario, nuestros precios no incluyen los impuestos ni los gravámenes correspondientes, como el IVA y cualquier otro impuesto sobre las ventas aplicable. En el caso de los clientes con una dirección de facturación de Japón, el uso de los servicios de AWS está sujeto al impuesto de consumo nipón. Más información.

Acceso a los servicios de AWS

Sí. Puede acceder a EFS desde aplicaciones en contenedor lanzadas por Amazon ECS a través de los tipos de lanzamiento EC2 y Fargate haciendo referencia a un sistema de archivos EFS en la definición de la tarea. Para más información sobre las instrucciones de introducción, consulte la documentación de ECS.

Sí. Puede acceder a EFS desde aplicaciones en contenedor lanzadas por Amazon EKS, con tipos de lanzamiento EC2 o Fargate, mediante el controlador EFS CSI. Encontrará las instrucciones para empezar en la documentación de EKS.

Sí. Puede acceder a EFS desde funciones que se ejecutan en Lambda al hacer referencia a un sistema de archivos EFS en la configuración de su función. Encontrará instrucciones para empezar en la documentación de Lambda.

Sí. Puede acceder a los datos de entrenamiento en EFS desde los trabajos de entrenamiento de Amazon SageMaker haciendo referencia a un sistema de archivos EFS en su solicitud CreateTrainingJob. EFS también se utiliza automáticamente para los directorios de inicio creados por SageMaker Studio.