Вопросы и ответы по Amazon EFS

Общие вопросы

Эластичная файловая система Amazon (Amazon EFS) предоставляет бессерверное и полностью эластичное хранилище файлов, с помощью которого можно совместно использовать данные файлов, не беспокоясь об обеспечении и обслуживании хранилища, а также его эффективности. Выбирая несколько элементов в Консоли управления AWS, можно создавать файловые системы, доступные для инстансов Эластичного облака вычислений Amazon (Amazon EC2), контейнерных сервисов Amazon (Эластичный сервис контейнеров Amazon [Amazon ECS], Эластичный сервис Amazon Kubernetes [Amazon EKS], AWS Fargate) и функций AWS Lambda, через интерфейс файловой системы (с использованием стандартных API ввода‑вывода файлов в операционной системе). Для таких файловых систем также поддерживается полная семантика доступа, включая строгую непротиворечивость и блокировку файлов.

Файловые системы Amazon EFS способны автоматически масштабироваться от нескольких гигабайтов до петабайтов данных без необходимости выделять хранилище заранее. Десятки, сотни или даже тысячи вычислительных инстансов могут одновременно получать доступ к файловой системе Amazon EFS, при этом Amazon EFS обеспечивает стабильную производительность для каждого вычислительного инстанса. Amazon EFS отличается высокой доступностью и надежностью. С Amazon EFS оплате подлежат только реально используемые ресурсы; минимальные взносы и платежи за настройку отсутствуют.

Сервис Amazon EFS предназначен для обеспечения производительности широкого спектра рабочих нагрузок и приложений, включая обработку и анализ больших данных, рабочие процессы обработки мультимедийных файлов, управление контентом и распространение файлов через Интернет, а также домашние каталоги.

Классы хранилища Amazon EFS Standard идеально подходят для работы с рабочими нагрузками, которые требуют наивысшего уровня надежности и доступности.

Классы EFS One Zone идеальны для таких рабочих нагрузок, как среды разработки, сборки и промежуточные. Они также превосходно подходят для аналитики, моделирования и транскодирования мультимедийного содержимого, а также для резервных копий или реплик локальных данных, не требующих устойчивости в нескольких зонах доступности.

AWS предлагает сервисы облачных хранилищ для широкого диапазона рабочих нагрузок, связанных с хранением данных.

EFS – это сервис хранения файлов, который используется с вычислительными (EC2, контейнерами, бессерверными) и локальными серверами Amazon. Сервис EFS предоставляет интерфейс файловой системы, семантику доступа к файловой системе (например, строгую непротиворечивость и блокировку файлов), а также хранилище, которое одновременно доступно тысячам инстансов EC2.

Amazon EBS – это сервис блочного хранилища для использования с EC2. EBS может обеспечить производительность для рабочих нагрузок, которым требуется наименьшая задержка при доступе к данным из одного инстанса EC2.

Amazon S3 – это сервис объектного хранилища. Сервис S3 с помощью API обеспечивает доступ к данным через Интернет, т. е. из любой точки.

Подробнее о том, на что стоит обратить внимание при оценке возможностей использования Amazon EFS.

Подробные сведения о доступности сервиса Amazon EFS по регионам см. на странице Продукты и сервисы по регионам.

Для использования сервиса Amazon EFS необходимо иметь аккаунт AWS. Если у вас еще нет учетной записи AWS, ее можно зарегистрировать и сразу получить доступ к Уровню бесплатного пользования AWS.

После создания учетной записи AWS ознакомьтесь с руководством по началу работы с EFS, чтобы приступить к использованию этого сервиса. Файловую систему можно создать с помощью консоли, AWS Command Line Interface (CLI), а также API EFS (и различных SDK для конкретных языков).

Для доступа к файловой системе необходимо осуществить подключение файловой системы к инстансу EC2 на базе Linux, используя стандартную команду подключения Linux и имя DNS файловой системы. Чтобы упростить доступ к файловым системам Amazon EFS, используйте сервисную программу Amazon EFS mount helper. После подключения с файлами и каталогами в файловой системе можно работать так же, как и с локальной файловой системой.

EFS использует протокол NFS (Network File System) версии 4. Пример настройки доступа к файловой системе с инстанса EC2 с пошаговым описанием см. в этом руководстве.

Amazon EFS – это полностью управляемый сервис, поэтому все управление инфраструктурой хранения файлов осуществляется за вас. При использовании сервиса Amazon EFS можно избежать сложности развертывания и обслуживания сложной инфраструктуры файловой системы. Файловая система Amazon EFS расширяется и сокращается автоматически по мере добавления и удаления файлов, так что вам не нужно заботиться об управлении ресурсами для хранения или о выделении таковых.

Администрировать файловую систему можно с помощью консоли, CLI или API EFS (и различных SDK для конкретных языков). Консоль, API и SDK предоставляют возможность создавать и удалять файловые системы, настраивать доступ к файловым системам, создавать и редактировать теги файловых систем, включать дополнительные возможности, такие как Provisioned Throughput и Lifecycle Management, а также отображать подробную информацию о файловых системах.  

AWS DataSync предоставляет быстрый способ безопасной синхронизации существующих файловых систем с Amazon EFS. DataSync работает через любое сетевое подключение, в том числе через AWS Direct Connect или AWS VPN. EFS, DataSync и Direct Connect без Amazon или AWS. Для перемещения файлов данных в Amazon EFS можно также использовать стандартные средства копирования Linux.

Дополнительную информацию о доступе к файловой системе с локального сервера см. в разделе Локальный доступ на этой странице вопросов и ответов.

Дополнительную информацию о перемещении данных в облако Amazon см. на странице Миграция данных в облако.

Масштабирование и производительность

Файловые системы Amazon EFS позволяют хранить петабайты данных. Файловые системы Amazon EFS эластичны, благодаря чему они автоматически увеличиваются и уменьшаются по мере добавления и удаления файлов. Заранее выделять размер файловой системы не требуется, а оплате подлежат только реально используемые ресурсы.

Amazon EFS поддерживает от одного до тысяч инстансов Amazon Elastic Compute Cloud (EC2), одновременно подключаемых к файловой системе.

Посетите страницу лимитов Amazon EFS, чтобы больше узнать об ограничениях Amazon EFS.

Ожидаемая производительность файловой системы Amazon EFS зависит от ее конкретной конфигурации (например, класса хранения и режима пропускания) и типа операций файловой системы (чтение или запись). См. документацию о производительности файловой системы, чтобы больше узнать об ожидаемой задержке, максимальной пропускной способности и максимальной производительности IOPS для файловых систем Amazon EFS.

Elastic Throughput – режим пропускной способности по умолчанию, подходящий для большинства файловых рабочих нагрузок. В стандартном режиме Elastic Throughput производительность автоматически масштабируется в зависимости от рабочей нагрузки, и вы платите только за используемую пропускную способность (данные, передаваемые файловыми системами в месяц). Elastic Throughput идеально подходит, если у вас нет информации о точной пиковой пропускной способности приложения или оно очень непредсказуемо с низкой базовой активностью (например, использует менее 5 % ресурсов в среднем, когда вы выделяете их для пиковых потребностей).

При желании вы можете изменить режим пропускной способности на Provisioned Throughput, если знаете требования своей рабочей нагрузки к пиковой пропускной способности и ожидаете, что ваша рабочая нагрузка будет потреблять большую часть (выше 5 % в среднем) от пиковой пропускной способности приложения.

Величина пропускной способности, которую вы можете предоставить, зависит от выбранного режима. Подробнее см. в разделе документации по производительности файловой системы.  Дополнительные сведения см. в разделе Производительность файловой системы.

Отслеживать файловую систему можно с помощью Amazon CloudWatch или на вкладке «Мониторинг» в консоли Amazon EFS. Дополнительные сведения см. в документации по мониторингу Amazon EFS.

При использовании эластичной пропускной способности вам начисляется плата за объем переданных данных (во время чтения и записи). Если вы получаете доступ к данным из классов хранилища редкого доступа, вы также будете платить за доступ к данным IA.

В режиме Provisioned Throughput плата начисляется отдельно за используемое хранилище и за выделенную пропускную способность. Расчет выполняется по часам на следующей основе.

Хранилище (за ГБ/месяц). Плата начисляется за объем использованного хранилища в ГБ/месяц.

Пропускная способность (за МБ/с в месяц). Плата начисляется за выделенную пропускную способность в МБ/с в месяц.

Вам не нужно накапливать или потреблять какие-либо кредиты на расширение, если вы используете режим Elastic Throughput. Вы можете продолжать просматривать существующий баланс кредитов на расширение на Amazon CloudWatch в режиме Elastic.

Надежность и доступность

Amazon EFS предлагает два типа файловых систем, которые можно выбрать в зависимости от ваших требований к надежности и доступности. Региональные файловые системы EFS (рекомендуемые) обеспечивают высочайший уровень надежности и доступности благодаря хранению данных в нескольких зонах доступности. Файловые системы EFS для одной зоны хранят данные в избыточном виде в одной зоне доступности, поэтому такие данные будут недоступны и могут быть потеряны во время чрезвычайной ситуации или другого сбоя в зоне доступности.

Amazon EFS рассчитана на 99,999999999 % (11 девяток) надежности объектов в течение года. Файловые системы EFS Regional предназначены для хранения данных в случае потери зоны доступности. Поскольку файловые системы EFS One Zone хранят данные в одной зоне доступности, эти данные могут быть утеряны во время аварии или другого сбоя в пределах зоны доступности.  

Как и для любой среды, рекомендуется иметь резервную копию и применять меры безопасности, защищающие от случайного удаления. Рекомендации по обработке данных в Amazon EFS включают репликацию файловых систем в нескольких регионах с помощью Amazon EFS Replication и функциональное регулярно проверяемое резервное копирование с помощью сервиса Резервное копирование AWS. Файловые системы, которые используют классы хранилищ EFS One Zone, по умолчанию автоматически создают резервные копии файлов при создании файловой системы.

Все объекты файловой системы EFS Regional (такие как каталог, файл или ссылка) хранятся в нескольких зонах доступности. В файловых системах EFS One Zone ваши данные резервно хранятся в одной зоне доступности. Amazon EFS предусматривает способность выдерживать параллельные отказы устройств, быстро обнаруживая и восстанавливая любую потерю избыточности.  

Доступ к данным файловой системы EFS осуществляется с помощью целевых объектов подключения к EFS для определенной зоны доступности, которые предназначены для обеспечения высокой доступности. Региональные файловые системы EFS поддерживают одновременный доступ с целевых объектов подключения EFS во всех зонах доступности в регионе, в котором они расположены. Это означает, что архитектура приложения может обрабатывать отказ, переключаясь с одной зоны доступности региона для достижения максимально высокого уровня доступности. Файловые системы EFS для одной зоны доступности поддерживают только один высокодоступный целевой объект подключения EFS в одной зоне доступности. Это означает, что данные могут стать недоступны во время чрезвычайной ситуации или другого сбоя в этой зоне доступности. Подробнее о доступности см. в Соглашении об уровне обслуживания Amazon EFS.

Файловые системы EFS One Zone не устойчивы к полному сбою в зоне доступности. Во время сбоя зоны доступности будет утеряна доступность, потому что данные файловой системы не реплицированы в другой зоне доступности. Во время аварии или сбоя в зоне доступности, влияющего на все копии ваших данных, вы можете потерять данные, не защищенные с помощью резервного копирования EFS или EFS Replication. Резервное копирование EFS включено по умолчанию для всех файловых систем EFS One Zone.

Для защиты файловой системы EFS One Zone от потери зоны доступности можно использовать Amazon EFS Replication или AWS Backup. С помощью Amazon EFS Replication реплицирует данные файловой системы в другой регион или в пределах одного региона. При этом не требуется дополнительная инфраструктура или специальный процесс для мониторинга и синхронизации изменений в данных. Репликация EFS выполняется практически непрерывно. Так обеспечивается Целевая точка восстановления (RPO) и Целевое время восстановления (RTO), измеряемое в минутах для многих файловых систем. 

Резервное копирование включено по умолчанию для всех файловых систем, которые используют классы хранилища Amazon EFS One Zone. Его можно отключать при создании файловых систем. Во время потери зоны доступности вы можете восстановить файловые данные из недавней резервной копии в новой файловой системе в любой рабочей зоне доступности. Если ваши данные хранятся в классах хранилища One Zone, во время потери зоны доступности могут быть утрачены файловые данные, которые были изменены с момента автоматического создания последней резервной копии.

Когда репликация включена, влиять на вашу целевую файловую систему может только EFS Replication. В это время доступ к реплике осуществляется в режиме «только для чтения». Во время аварии можно выполнить переход на файловую систему назначения, удалив конфигурацию репликации из консоли или с помощью API DeleteReplicationConfiguration. При удалении репликации Amazon EFS остановит репликацию дополнительных изменений и разрешит внесение записей в файловую систему назначения. Затем можно адресовать приложение к файловой системе назначения, чтобы продолжить выполнение операций. После сбоя состояние файловой системы назначения можно проверить в консоли Amazon EFS или с помощью вызова API DescribeReplicationConfigurations.

Нет. EFS Replication поддерживает репликацию только между двумя файловыми системами.

Нет. Amazon EFS не поддерживает репликацию файловых систем в другой аккаунт AWS.

Нет. Для EFS Replication не требуются кредиты, и работа функции не влияет на лимит операций ввода-вывода и ограничение пропускной способности ни одной файловой системы в репликационной паре.

Да. При первом включении EFS Replication реплицированная файловая система будет находиться в режиме «только для чтения», а исходная файловая система целиком будет скопирована в выбранное место назначения. Время выполнения операции зависит от размера исходной файловой системы. Несмотря на то что переход на файловую систему назначения можно выполнить в любой момент, рекомендуется дождаться завершения копирования, чтобы свести потерю данных к минимуму. Ход репликации отслеживается в консоли Amazon EFS, где указывается время последней синхронизации исходной файловой системы и файловой системы назначения.

Классы хранилища и управление жизненным циклом

Amazon EFS предлагает три класса хранилищ: стандартное хранилище EFS, хранилище EFS для нечастого доступа и архив EFS. Часто используемые данные требуют более высокой производительности, поэтому EFS предлагает стандартное хранилище EFS на базе твердотельных накопителей (SSD) для обеспечения задержек менее миллисекунды. Для данных, к которым обращаются редко, можно использовать два оптимизированных по стоимости класса хранилищ EFS, которые обеспечивают низкую задержку продолжительностью не более ста миллисекунд: хранилище EFS Infrequent Access (IA), предназначенное для доступа к данным всего несколько раз в квартал, и EFS Archive для доступа к данным менее нескольких раз в год. Хранилище EFS IA на 95 % дешевле, чем EFS Standard для редко используемых данных. EFS Archive обеспечивает более экономичную работу с еще редко используемыми данными и предлагает на 50 % меньшую стоимость, чем EFS Infrequent Access, а также более высокую плату за запросы при доступе к этим данным. EFS Archive оптимизирован и поддерживается в региональных файловых системах EFS с использованием стандартного режима Elastic Throughput в EFS. Дополнительные сведения см. на страницах Классы хранилищ EFS и Цены на EFS.

Включив управление жизненным циклом EFS, вы можете автоматически распределять файлы между классами хранилищ в соответствии с вашими шаблонами доступа. Рекомендуемая по умолчанию политика жизненного цикла предусматривает перенос файлов из EFS Standard в EFS IA после 30 последовательных дней отсутствия доступа и в EFS Archive после 90 последовательных дней отсутствия доступа. Можно также указать собственную политику для переноса файлов между классами хранения в зависимости от количества дней с момента последнего доступа к файлу.

Кроме того, можно включить функцию EFS Intelligent-Tiering, позволяющую возвращать файлы из EFS IA и EFS Archive в EFS Standard при обращении к ним, что обеспечивает последующее чтение этих файлов с более низкой задержкой, чем в EFS Standard (менее миллисекунды). После продвижения эти файлы вернутся в соответствующий класс хранилища IA или Archive согласно вашей политике жизненного цикла.

По сравнению с классом EFS Standard, EFS IA и Archive обеспечивают ту же пропускную способность и масштабируемость операций ввода-вывода в секунду, но имеют более высокую задержку в первом байте (т.е. низкие двузначные миллисекундные задержки чтения по сравнению с задержками чтения длительностью меньше одной миллисекунды на EFS Standard). Дополнительную информацию см. в документации по производительности Amazon EFS.

EFS Intelligent‑Tiering обеспечивает автоматическое сокращение расходов на рабочие нагрузки с неизвестной или меняющейся схемой доступа. В EFS Intelligent-Tiering используется EFS Lifecycle Management для мониторинга закономерностей доступа вашей рабочей нагрузки. Он используется для автоматического перемещения файлов, к которым не осуществлялся доступ в течение срока политики жизненного цикла (например, 30 дней), из классов хранилищ с оптимизированной производительностью (EFS Standard или EFS One Zone) в соответствующий класс оптимизированного по стоимости хранилища для файлов с нечастым доступом (EFS Standard-Infrequent Access или EFS One Zone-Infrequent Access). Он помогает вам использовать ценовое преимущество хранилищ IA, в котором цены на хранение файлов до 92 % ниже, чем цены EFS Standard или EFS One Zone. Если шаблоны доступа меняются, и к этим данным вновь осуществляется доступ, то Lifecycle Management автоматически перемещает файлы обратно в хранилище EFS Standard или EFS One Zone, снижая риск взимания платы за неограниченный доступ. Как только доступ к файлам вновь становится нечастым, Lifecycle Management, в соответствии с политикой жизненного цикла, переносит их обратно в подходящий класс хранилища IA.

В EFS IA нет минимального срока хранения. Минимальный срок хранения многоуровневых данных в EFS Archive составляет 90 дней. За файлы, удаленные или урезанные до истечения минимального срока действия, взимается пропорциональная плата за оставшиеся дни в зависимости от их размера до принятия соответствующего действия.

Используйте EFS Intelligent-Tiering для автоматического переноса файлов между классами хранилищ с оптимизированными производительностью и стоимостью в случае, когда шаблон доступа неизвестен. Активируйте EFS Lifecycle Management, выбрав политику автоматического перемещения файлов в EFS Standard - IA или EFS One Zone - IA. Дополнительно выберите политику автоматического возврата файлов в EFS Standard или EFS One Zone при осуществлении доступа. EFS Intelligent-Tiering позволит снизить расходы на хранение, даже если шаблоны доступа к приложениям неизвестны или меняются с течением времени. С двумя настроенными политиками Lifecycle Management вы платите только за перенос данных между классами хранилища, а не за каждый доступ к ним. Среди примеров рабочих нагрузок с неизвестными шаблонами доступа веб-ресурсы и блоги, хранящиеся в системах управления контентом, журналы, файлы вывода машинного обучения (МО) и генетические данные.

Оптимизированные по стоимости классы хранения данных EFS (IA, Archive) предназначены для хранения редко используемых неактивных данных, которые обычно состоят из больших файлов. Минимальный размер файла для IA или Archive не установлен, но за файлы, распределенные по уровням хранения этих классов и размером менее 128 КБ, взимается плата за хранение, как если бы они составляли 128 КБ.

При использовании классов хранилища EFS Standard-IA и EFS One Zone-IA поддерживаются все возможности Amazon EFS. Файлы менее 128 КиБ не могут быть обработаны компонентом Lifecycle Management (управления жизненным циклом) и всегда сохраняются в хранилище класса EFS Standard или EFS One Zone.

Задержка первого байта при чтении из EFS Standard-IA и EFS One Zone-IA и при записи в них превышает задержку классов хранилища EFS Standard или EFS One Zone. Классы хранилищ EFS Standard and EFS One Zone обеспечивают задержки операций чтения в доли миллисекунд, а задержки операций записи – в среднем менее 10 мс. Задержка в классах хранилищ EFS Standard-IA и EFS One Zone-IA в среднем составляет не более ста миллисекунд.

В режиме пропускной способности Bursting по умолчанию показатель пропускной способности, на которую можно рассчитывать при работе с файловой системой Amazon EFS, линейно масштабируется в зависимости от объема данных, сохраненных в хранилище класса EFS Standard или EFS One Zone. Все файловые системы Amazon EFS, независимо от размера, могут обеспечить пиковую пропускную способность до 100 МиБ в секунду. Файловые системы, в которых более 1 ТиБ данных хранится в классах хранилищ EFS Standard или EFS One Zone, могут достигать пропускной способности 100 МиБ в секунду на 1 ТиБ данных, хранящихся в классах хранилищ EFS Standard или EFS One Zone. Если для работы с классами хранилищ EFS Standard-IA или EFS One Zone-IA требуется более высокая пропускная способность, используйте Amazon EFS Elastic Throughput или Provisioned Throughput. Дополнительную информацию см. в документации по производительности Amazon EFS.

Защита данных

Резервное копирования Amazon EFS работает на базе Резервного копирования AWS – полностью управляемого сервиса резервного копирования, который централизованно управляет и автоматизирует резервное копирование файловых систем Amazon EFS. Данный сервис защищает файловую систему от потери данных, автоматически и по расписанию создавая инкрементные копии файловой системы в централизованном месте. Сервис резервного копирования AWS предоставляет централизованную консоль, планирование автоматического резервного копирования, управление сроком хранения резервных копий и активностью по восстановлению. Чтобы узнать больше, ознакомьтесь с документацией по Резервному копированию AWS или ответами на часто задаваемые вопросы.

Amazon EFS изначально интегрирован с резервным копированием AWS. Для автоматического резервного копирования можно использовать консоль EFS, API и интерфейс командной строки AWS (AWS CLI). При этом используется план резервного копирования по умолчанию с рекомендованными настройками резервного копирования AWS. Во время первоначального резервного копирования копия всей файловой системы создается в резервном хранилище. Все последующие резервные копии этой файловой системы носят инкрементный характер, т.е. копируются только измененные, добавленные или удаленные файлы и каталоги. При каждом добавочном резервном копировании сервис Резервное копирование AWS сохраняет необходимые справочные данные для полного восстановления. В случае потери данных можно выполнить полное или частичное восстановление файловой системы с помощью консоли Резервного копирования AWS или интерфейса командной строки.   

Безопасность

Вы контролируете, какие инстансы EC2 могут обращаться к вашей файловой системе, используя правила группы безопасности VPC и политики IAM. Используйте группы безопасности VPC для управления входящим и исходящим сетевым трафиком файловой системы. Подключите политику IAM к вашей файловой системе, чтобы контролировать, какие клиенты могут монтировать вашу файловую систему и с какими разрешениями, а также использовать точки доступа EFS для управления доступом к приложениям. Доступ к файлам и каталогам можно контролировать с помощью POSIX-совместимых прав на уровне пользователей и групп.

Используя консоль Amazon EFS, вы можете применять к вашей файловой системе общие политики, такие как отключение корневого доступа, принудительный доступ только для чтения или принудительное шифрование всех подключений к вашей файловой системе. Вы также можете применять более сложные политики, такие как предоставление доступа к определенным ролям IAM, в том числе в других учетных записях AWS.

 

EFS Access Point – это адрес сети, с помощью которого пользователи и приложения могут получать доступ к файловой системе EFS и применять разрешения на уровне файлов и папок (POSIX) на основе точного контроля доступа и разрешений на основе политик, определенных в IAM.

EFS Access Points предоставляет гибкие возможности для создания многоарендаторских сред и управления ими для ваших файловых приложений оптимизированным для облака способом, помогая вам упростить общее использование данных. В отличие от традиционных POSIX ACL для контроля доступа к файловой системе или Kerberos для управления аутентификацией, которые требуют сложной настройки, управления и обслуживания и часто становятся причиной рисков, EFS Access Points интегрируется с IAM, предоставляя возможность приложениям, оптимизированным для облака, использовать общее хранилище файлов на основе POSIX. Преимущественные варианты использования Amazon EFS Access Points включают среды на основе контейнеров, в которых разработчики создают и разворачивают свои собственные контейнеры, приложения для обработки данных, которым требуется доступ к рабочим данным, и совместное использование определенного каталога в файловой системе с другими аккаунтами AWS.

При создании точки доступа Amazon EFS Access Point вы можете настроить пользователя и группу операционной системы, а также корневой каталог для всех подключений, которые ее используют. Если вы укажете владельца корневого каталога, EFS автоматически предоставит ему разрешения, которые используются при первом подключении клиента к точке доступа. Вы также можете обновить политику IAM вашей файловой системы таким образом, чтобы она применялась к вашим точкам доступа. Например, вы можете применить политику, которая требует наличия определенного удостоверения IAM, чтобы выполнить соединение с данной точкой доступа. Подробнее см. в Руководстве пользователя Amazon EFS.

Amazon EFS предлагает возможность шифрования данных при хранении и передаче.

Шифрование при хранении обеспечивает прозрачное шифрование данных при записи и прозрачное дешифрование во время чтения; изменения в код приложений вносить не требуется. Ключи шифрования управляются сервисом AWS KMS, что исключает необходимость создания и поддержки собственной инфраструктуры безопасного управления ключами.

Шифрование данных при передаче использует стандартный отраслевой протокол Transport Layer Security (TLS) 1.2 для шифрования данных, которыми обмениваются клиенты и файловые системы EFS.

В целях соответствия уникальным требованиям в области безопасности шифрование данных при хранении и передаче можно настроить как совместно, так и отдельно.

Дополнительную информацию см. в документации пользователя по шифрованию.

AWS KMS – это управляемый сервис, который упрощает создание ключей для шифрования данных и управление ими. AWS KMS интегрирован с другими сервисами AWS, включая EFS, EBS и S3, что упрощает шифрование данных с использованием ключей шифрования, находящихся под управлением клиента. Сервис управления ключами AWS (AWS KMS) также интегрирован с AWS CloudTrail и предоставляет журналы использования ключей для обеспечения соответствия нормативным требованиям.

Шифрование данных при хранении можно включить в консоли EFS, с помощью CLI или SDK. При создании новой файловой системы в консоли EFS выберите «Create File System» (Создать файловую систему) и затем установите флажок для включения шифрования.

Данные можно шифровать при передаче из файловой системы Amazon EFS к ее клиентам и обратно с помощью вспомогательного средства подключения Amazon EFS.

В целях соответствия уникальным требованиям в области безопасности шифрование данных при хранении и передаче можно настроить как совместно, так и отдельно.

Дополнительную информацию см. в документации пользователя по шифрованию.

Шифрование данных оказывает минимальное влияние на задержку операций ввода-вывода и на пропускную способность.

Локальный доступ

Для доступа к файловой системе EFS необходимо настроить между локальным ЦОД и виртуальным частным облаком (VPC) подключение с использованием Direct Connect или AWS VPN.

Подключение файловой системы Amazon EFS к локальному серверу Linux выполняется с помощью стандартной команды Linux для подключения файловой системы по протоколу v4.1.

Дополнительную информацию о доступе к файловой системе Amazon EFS с локальных серверов см. в документации.

Файловые системы Amazon EFS можно подключать к локальным серверам и перемещать данные в Amazon EFS и из него с помощью стандартных инструментов и скриптов Linux или AWS DataSync. Возможность перемещать данные в файловую систему Amazon EFS и из нее позволяет реализовать три примера использования.

Во-первых, можно перемещать данные из локальных ЦОД для постоянного размещения в файловых системах EFS.

Во-вторых, можно осуществлять быстрое масштабирование облачных рабочих нагрузок, чтобы переносить нагрузки по обработке приложений в облако. Можно перемещать данные с локальных серверов в файловые системы Amazon EFS, анализировать их в кластере инстансов EC2 в облаке Amazon VPC и хранить результаты на постоянной основе в файловых системах Amazon EFS или перемещать их обратно на локальные сервера.

В-третьих, можно периодически копировать локальные файлы данных в файловую систему Amazon EFS в рамках систем резервного копирования и аварийного восстановления.

Да. Можно осуществлять доступ к файловой системе Amazon EFS одновременно с локальных серверов ЦОД и инстансов EC2 в облаке Amazon VPC. Amazon EFS обеспечивает единую семантику доступа к файловой системе, например строгую непротиворечивость и блокировку файлов, для всех инстансов EC2 и локальных серверов, осуществляющих доступ к файловой системе.

Существует несколько способов скопировать существующие локальные данные в Amazon EFS. AWS DataSync обеспечивает быстрый и простой способ безопасной синхронизации существующих файловых систем с EFS и работает по любой сети, в том числе через AWS Direct Connect.

AWS Direct Connect обеспечивает выделенное сетевое подключение с высокой пропускной способностью и низкой задержкой. Его можно использовать для подключения файловых систем EFS. После подключения для копирования данных в EFS можно использовать DataSync, при этом копирование выполняется до 10 раз быстрее, чем при использовании стандартных средств копирования Linux.

Дополнительные сведения об AWS DataSync см. в разделе Передача данных на этой странице вопросов и ответов.

Передача данных

DataSync – это онлайн-сервис переноса данных, который ускоряет и упрощает их перенос из локальных хранилищ в Amazon EFS и наоборот. DataSync использует специальный протокол для ускорения и обеспечения безопасности переноса данных через Интернет или Direct Connect на скорости до 10 раз больше, чем при использовании инструментов с открытым исходным кодом. С помощью DataSync можно выполнять однократные переносы данных, переносить локальные данные для своевременного анализа в облаке и автоматизировать репликацию данных в AWS в целях защиты и обеспечения возможности восстановления.

Семейство для пересылки файлов AWS – это полностью управляемый сервис передачи файлов, который взаимодействует с протоколами Secure File Transfer Protocol (SFTP), File Transfer Protocol over SSL (FTPS) и File Transfer Protocol (FTP). Группа сервисов AWS Transfer Family предоставляет полностью управляемый сервис передачи данных с высоким уровнем доступности и возможностями автомасштабирования, избавляя вас от необходимости в управлении инфраструктурой, связанной с передачей файлов. Рабочие процессы конечных пользователей остаются без изменений, а данные, отправляемые и загружаемые с помощью выбранных протоколов, хранятся в файловой системе Amazon EFS.

Чтобы начать работу с DataSync, с помощью консоли или CLI нужно подключить агент к локальным или облачным файловым системам по протоколу NFS, указать файловую систему Amazon EFS и начать копировать данные. Сначала необходимо развернуть программный агент, который доступен для загрузки из консоли, за исключением случаев копирования файлов между двумя файловыми системами Amazon EFS.

Прежде чем начать работу с AWS Transfer Family, убедитесь, что каталоги файловой системы доступны пользователям POSIX, которых вы планируете назначить для работы с AWS Transfer. Затем можно использовать Консоль, интерфейс командной строки (CLI) или API для создания конечной точки Transfer Family и пользователей. После завершения ваши конечные пользователи смогут использовать клиенты SFTP, FTP или FTPS для доступа к данным, хранящимся в файловой системе Amazon EFS.

DataSync можно использовать для перемещения файлов между двумя файловыми системами Amazon EFS, в том числе если они находятся в разных регионах AWS. Конечные точки AWS Transfer Family должны находиться в том же регионе, что и файловая система Amazon EFS.

Да. DataSync можно использовать для копирования файлов в файловую систему Amazon EFS с другого аккаунта AWS.

Также можно настроить файловую систему Amazon EFS для доступа к AWS Transfer Family с другого аккаунта, если для этого аккаунта имеются соответствующие разрешения. Подробнее о предоставлении разрешений Семейства для пересылки файлов AWS внешним учетным записям с помощью политик файловой системы см. в документации.

Совместимость

EFS интегрирован с рядом других сервисов AWS, включая CloudWatch, AWS CloudFormation, CloudTrail, IAM и AWS Tagging.

CloudWatch помогает контролировать работу файловой системы с помощью метрик. CloudFormation помогает создавать файловые системы и управлять ими с помощью шаблонов.

CloudTrail помогает записывать все вызовы API EFS в файлы журналов.

IAM помогает контролировать административный доступ к вашей файловой системе. Сервисы AWS Tagging помогают помечать файловые системы с помощью заданных пользователем метаданных.

Расходы на файловую систему Amazon EFS можно планировать и контролировать с помощью сервиса AWS Budgets. С AWS Budgets можно работать из консоли AWS Billing and Cost Management. Для использования Бюджетов AWS вы создаете месячный бюджет расходов на файловые системы Amazon EFS.

Блокировка в Amazon EFS определяется протоколом v4.1 для рекомендуемой блокировки и позволяет приложениям использовать блокировку как всего файла, так и диапазона байтов.

Каждая файловая система имеет автоматически сгенерированный идентификационный номер, который является уникальным. Можно дополнительно пометить файловую систему с помощью названия, при этом названия не обязательно должны быть уникальными.

Цены и оплата

В Amazon EFS вы платите только за используемое основное хранилище и хранилище резервных копий, а также за чтение, запись и многоуровневое хранение файловой системы EFS. Также вы платите за доступ для чтения и записи с помощью Elastic Throughput (но при желании можете заранее использовать Provisioned Throughput), а также за многоуровневое распределение данных в классах EFS Infrequent Access и Archive.

Эластичная файловая система Amazon (Amazon EFS) предлагает три класса хранилищ: стандартное хранилище EFS, обеспечивающее задержку менее миллисекунды для активно используемых данных; хранилище EFS для нечастого доступа (EFS IA), оптимизированное по стоимости для данных, доступ к которым осуществляется всего несколько раз в квартал; и архив EFS, оптимизированный по стоимости для долговременных данных, доступ к которым осуществляется несколько раз в год или реже.

EFS также обеспечивает защиту данных ваших файлов с помощью резервного копирования EFS и EFS Replication. При использовании резервного копирования EFS вы платите только за объем используемого вами хранилища для резервных копий, а также за восстанавливаемый в месяц объем данных резервного копирования. Минимальные платежи и плата за настройку отсутствуют. Посетите страницу Резервное копирование AWS, чтобы узнать больше. Репликация EFS позволяет дублировать файловые системы в выбранный регион или зону доступности без управления дополнительной инфраструктурой либо создания пользовательских процессов.

Вы можете оценить ежемесячные расходы с помощью Калькулятора цен Amazon EFC.

Для начала работы с Amazon EFS не требуются предоплата или какие-либо обязательства. В конце месяца с вас будет автоматически снята сумма за пользование сервисом по итогам месяца. Вы можете в любое время просмотреть свои расходы за текущий расчетный период, войдя в аккаунт Amazon Web Services и выбрав панель управления счетами, связанную с вашим профилем консоли.

На уровне бесплатного пользования AWS* учитывается каждый месяц во всех регионах AWS, за исключением региона AWS GovCloud, и автоматически применяется к счету. Неиспользованные в течение месяца ресурсы на следующий месяц не переносятся. После регистрации новые клиенты EFS ежемесячно получают 5 ГБ Amazon EFS Standard в течение одного года. Уровень бесплатного пользования AWS не распространяется на файлы, хранящиеся в файловой системе EFS One Zone. Действуют определенные ограничения. Дополнительные сведения см. в условиях предложения.

Amazon EFS взимает плату за следующие типы использования. Обратите внимание на то, что приведенные расчеты не учитывают возможность применения уровня бесплатного пользования AWS.

Использованный объем хранилища

Сумма Amazon EFS, выставляемая за месяц, зависит от использования хранилища, пропускной способности и защиты данных за месяц. Затраты на хранение рассчитываются на основе среднего объема дискового пространства, использованного в течение месяца. Использование хранилища измеряется в ГБ-месяцах, которые суммируются в конце месяца для подсчета итоговой стоимости. 

В следующем примере показан сценарий, в котором шаблоны доступа к файлам меняются с течением времени, и включены все аспекты ценообразования на EFS IA и EFS Archive. Пример подразумевает, что установлены две политики жизненного цикла EFS для перемещения файлов между EFS Standard, EFS Infrequent Access (IA) и EFS Archive.

Предположим, что ваша файловая система находится в регионе Восток США (Северная Вирджиния). В начале месяца (31 день) ваша файловая система хранит 200 ГБ файлов в EFS Standard, 500 ГБ файлов в EFS IA и 2 ТБ файлов в EFS Archive. 15-го числа каждого месяца управление жизненным циклом EFS, не применяя сервисы интеллектуального многоуровневого хранения, перемещает 50 % файлов EFS Standard в класс EFS IA и 10 % файлов EFS IA в класс EFS Archive по истечение 14-дневного периода отсутствия доступа. В среднем клиентское приложение ежемесячно читает 200 ГБ файлов из EFS IA и 100 ГБ файлов из архива EFS.

Сначала давайте рассчитаем пропорциональное использование хранилища:

Хранилище Standard
200 ГБ хранилища EFS Standard в течение 14 дней (ГБ-часы): 200 ГБ * 14 дней * (24 часа в день) = 67 200 ГБ-часов
100 ГБ хранилища EFS Standard в течение 17 дней (ГБ-часы): 100 ГБ * 17 дней * (24 часа в день) = 40 800 ГБ-часов
Суммарное использование хранилища EFS Standard (ГБ-часы): 67 200 ГБ-часов + 40 800 ГБ-часов = 108 000 ГБ-часов

Хранилище IA
500 ГБ хранилища EFS IA в течение 14 дней (ГБ-часы): 500 ГБ * 14 дней * (24 часа в день) = 168 000 ГБ-часов
100 ГБ файлов от EFS Standard до EFS IA в течение 17 дней (ГБ-часов) = 100 ГБ * 17 * (24 часа в день) = 40 800 ГБ-часов
450 ГБ EFS IA (после переноса 50 ГБ в архив EFS): 450 ГБ * 17 * (24 часа в сутки) = 183 600 ГБ-часов

Суммарное использование хранилища EFS IA (ГБ-часы): 168 000 ГБ-часов + 40 800 ГБ-часов + 326 400 ГБ-часов = 392 400 ГБ-часов

Хранилище Archive
2 ГБ хранилища EFS IA в течение 31 дня (ГБ-часы): 1000 ГБ * 14 дней * (24 часа в день) = 1 488 000 ГБ-часов
50 ГБ файлов из EFS IA в EFS Archive в течение 17 дней (ГБ-часы): 50 ГБ * 17 * (24 часа в сутки) = 20 400 ГБ-часов
Суммарное использование хранилища EFS Archive (ГБ-часы): 1 488 000 ГБ-часов + 20 400 ГБ-часов = 1 508 400 ГБ-часов

Далее мы конвертируем использованный объем хранилища в ГБ-месяцы и рассчитываем стоимость хранения:
Суммарная стоимость использования хранилища EFS Standard: 108 000 ГБ-часов * (1 месяц / 744 часа) * 0,30 USD за ГБ‑месяц = 43,55 USD
Суммарная стоимость использования хранилища EFS IA: 392 400 ГБ-часов * (1 месяц / 744 часа) * 0,0165 USD за ГБ‑месяц = 8,70 USD
Суммарная стоимость использования хранилища EFS Archive: 1 508 400 ГБ-часов * (1 месяц / 744 часа) * 0,008 USD за ГБ‑месяц = 16,22 USD
Суммарная стоимость использования EFS: 43,55 USD + 8,70 USD + 16,22 USD =68,47 USD

Потом мы рассчитываем плату за доступ к файлам в EFS IA и EFS Archive.

Многоуровневое хранение данных в IA
Многоуровневое хранение данных (файлы, перемещенные из EFS Standard в EFS IA): 100 ГБ * 0,01 USD за ГБ = 1,00 USD
Плата за доступ для чтения IA: 200 ГБ * 0,01 USD за ГБ = 2,00 USD

Плата за чтение с эластичной пропускной способностью: 200 ГБ * 0,03 USD за ГБ = 6,00 USD

Общая стоимость многоуровневого хранения и доступа к EFS IA: 1,00 USD + 2,00 USD + 6,00 USD = 9,00 USD

Многоуровневое хранение данных в Archive
Многоуровневое хранение данных (файлы, перемещенные из Infrequent Access в Archive): 50 ГБ * 0,03 USD за ГБ = 1,50 USD
Плата за доступ к архиву для чтения: 100 ГБ * 0,03 USD/ГБ = 3,00 USD

Плата за чтение с эластичной пропускной способностью: 100 ГБ * 0,03 USD/ГБ = 3,00 USD

Общая стоимость многоуровневого хранения и доступа к EFS IA: 1,50 USD + 3,00 USD + 3,00 USD = 7,50 USD

Общая плата за многоуровневое хранение и доступ к EFS: 9,00 USD + 7,50 USD = 16,50 USD

И наконец, рассчитывается суммарная стоимость использования EFS за месяц:

Суммарная стоимость использования за месяц = суммарная стоимость хранения + суммарная стоимость доступа: 68,47 USD + 16,50 USD = 84,97 USD (совокупная стоимость владения составляет 0,0315 USD за ГБ)

С помощью Elastic Throughput можно получить доступ к данным для операций чтения и записи. В Elastic Throughput производительность автоматически масштабируется в зависимости от рабочей нагрузки, и вы платите только за используемую пропускную способность (данные, передаваемые файловыми системами в месяц). Сумма за Elastic Throughput, выставляемая за месяц, основана на данных чтения и записи, переданных в течение месяца, и измеряется в переданных ГБ.

Вы можете применять Provisioned Throughput, если знаете, что ваше приложение использует пропускную способность и пиковые требования к пропускной способности. Сумма за Provisioned Throughput, выставляемая за месяц, основана на средней выделенной пропускной способности, превышающей допустимую в EFS Standard за месяц, вплоть до базовых лимитов пропускной способности Bursting в регионе AWS и измеряется в МБ/с-месяцах.

Пример с Elastic Throughput

Предположим, что ваша файловая система расположена в регионе Восток США (Северная Вирджиния) и имеет 100 ГБ хранилища EFS Standard на месяц (31 день). Предположим, что передача данных в рабочей нагрузке составляет 75 % операций чтения и 25 % операций записи, а максимальная пропускная способность – 100 МБ/с в течение 3 часов в день и 3 дней в неделю, а остальное время она находится в режиме ожидания.  

Суммарная стоимость использования Elastic Throughput в месяц

При условии, что все данные передаются в хранилище EFS Standard, в конце месяце потребленные ресурсы в ГБ будут выглядеть следующим образом:

Суммарное количество данных с использованием Elastic Throughput за месяц (ГБ): 100 МБ/с * (60 минут * 60 секунд * 3 часа) * 3 дня * 4 недели / 1000 = 12960 ГБ 
Суммарное количество прочитанных данных с использованием Elastic Throughput (ГБ): 75 % * 12960 ГБ = 9720 ГБ
Суммарное количество записанных данных с использованием Elastic Throughput (ГБ): 25 % * 12960 ГБ = 3240 ГБ

Затем вычисляется суммарная стоимость использования эластичной пропускной способности за месяц. 

Стоимость использования Elastic Throughput для считываемых данных: 9,720 ГБ * 0,03 USD за 1 ГБ = 291,60 USD 
Стоимость использования Elastic Throughput для записываемых данных: 3,240 ГБ * 0,06 USD за 1 ГБ = 194,40 USD
Затем вычисляется суммарная стоимость использования эластичной пропускной способности за месяц.
Общая ежемесячная плата за Elastic Throughput: 291,60 USD + 194,40 USD = 486,00 USD

Пример с Provisioned Throughput

Если исходить из тех же предположений, что и в приведенном выше примере с Elastic Throughput (ваша файловая система расположена в регионе Восток США (Северная Вирджиния) и имеет 100 ГБ хранилища EFS Standard на месяц (31 день). Предположим, что передача данных в вашей рабочей нагрузке составляет 75 % операций чтения и 25 % операций записи, а максимальная пропускная способность составляет 100 МБ/с в течение 3 часов в день и 3 дней в неделю, а также
простаивает в течение оставшегося времени). Стоимость пропускной способности за месяц рассчитывается по среднему объему пропускной способности, предоставленной сверх того, что позволяет хранилище EFS Standard за месяц (50 Кбит/с базовой пропускной способности за 1 ГБ хранилища Standard)

Базовая пропускная способность (МБ/с в месяц) = 100 ГБ хранилища Standard * 50 Кбит/с / 1000 = 5 МБ/с в месяц.
Общий оплачиваемый режим Provisioned Throughput (МБ/с-месяц) = настроенная пропускная способность –
базовая пропускная способность = 100 МБ/с-месяц – 5 МБ/с-месяц = 95 МБ/с-месяц
Суммарная месячная плата за Provisioned Throughput = 95 МБ/с-месяц * 6 USD /МБ/с-месяц = 570,00 USD

Для защиты данных можно дополнительно использовать EFS Replication или Резервное копирование AWS. При использовании EFS Replication вы платите за хранилище, за доступ к классам Infrequent Access и Archive, а также за изменение передачи данных, если целевая файловая система находится в другом регионе AWS. Используя Резервное копирование AWS, вы платите за средний объем данных, резервируемых и восстановленных за месяц.

Репликация

Согласно сценарию, приведенному в этом примере, вы реплицируете файловые системы в нескольких регионах с помощью EFS Replication. В примере основное внимание уделяется затратам, связанным непосредственно с EFS Replication.

Предположим, ваша файловая система EFS с объемом данных 1 ТБ располагается в регионе Восток США (Северная Вирджиния). Файловая система реплицируется в регион Запад США (Орегон). Предположим, файловая система назначения использует 7-дневную политику управления жизненным циклом EFS для перемещения файлов в класс хранилища EFS IA.

При первом включении репликации исходная файловая система целиком копируется в файловую систему назначения. Реплицированные данные сначала попадают в класс EFS Standard файловой системы назначения. Если доступ к файлам не осуществляется в течение периода политики управления жизненным циклом EFS (7 дней), они перемещаются в EFS IA.

Начальная синхронизация

Сперва мы рассчитываем пропорциональное использование хранилища файловой системы назначения:
Суммарное использование хранилища EFS Standard (ГБ-часы): 1000 ГБ * 7 день * 24 часа в день = 168 000 ГБ-часов
Суммарное использование хранилища EFS IA (ГБ-часы): 1000 ГБ * 24 дня * (24 часа в день / 31 день месяца) = 576 000 ГБ-часов

Далее мы конвертируем использованный объем хранилища в ГБ-месяцы и рассчитываем стоимость хранения для файловой системы назначения:

Суммарная стоимость использования хранилища EFS Standard: 168 000 * (1 месяц / 744 часа) * 0,30 USD за ГБ‑месяц = 67,74 USD
Суммарная стоимость использования хранилища EFS IA: 576 000 USD * (1 месяц /744 часа) * 0,025 USD за ГБ-месяц = 19,36 USD
Суммарная стоимость хранения для начальной синхронизации: 67,74 USD + 19,36 USD = 87,10 USD
Затем мы рассчитываем стоимость передачи данных при первоначальной репликации исходной файловой системы в целевую.
Суммарная стоимость передачи данных EFS Replication за 1 ТБ данных: 1000 ГБ * 0,02 USD за ГБ = 20,00 USD

Суммарная стоимость начальной синхронизации = суммарная стоимость хранения для начальной синхронизации + суммарная стоимость передачи данных для начальной синхронизации: 87,10 USD + 20,00 USD = 107,10 USD

Инкрементная репликация

Примем, что по истечении 7 дней в исходную файловую систему было добавлено 150 ГБ новых данных. Новые данные реплицируются в файловую систему назначения и попадут, как и прежде, в класс EFS Standard в соответствии с 7-дневной политикой управления жизненным циклом. Пропорциональное использование хранилища для 150 ГБ новых данных высчитывается следующим образом.

Суммарное использование хранилища EFS Standard (ГБ-часы): 150 ГБ * 7 дней * 24 часа в день = 25 200 ГБ-часов
Суммарное использование хранилища EFS IA (ГБ-часы): 150 ГБ * 17 дней * 24 часа в день = 61 200 ГБ-часов

Далее мы конвертируем использованный объем хранилища в ГБ-месяцы и рассчитываем стоимость хранения 150 ГБ новых данных для файловой системы назначения: 

Суммарная стоимость использования хранилища EFS Standard: 25 200 * (1 месяц / 744 часа) * 0,30 USD за ГБ‑месяц = 10,16 USD
Суммарная стоимость использования хранилища EFS IA: 61 200 USD * (1 месяц / 744 часа) * 0,025 USD за ГБ‑месяц = 2,06 USD
Суммарная стоимость хранения для инкрементной репликации: 10,16 USD + 2,06 USD = 12,22 USD

Наконец, считаем плату за передачу 150 ГБ новых инкрементных данных.

Общая стоимость передачи данных при инкрементальной репликации: 150 ГБ * 0,02 USD за ГБ = 3,00 USD
Суммарная стоимость инкрементной репликации = суммарная стоимость хранения для инкрементной репликации + суммарная стоимость передачи данных для инкрементной репликации: 12,22 USD + 3,00 USD = 15,22 USD

Суммарная стоимость EFS Replication: суммарная стоимость начальной синхронизации + суммарная стоимость инкрементной репликации = 107,10 USD + 15,22 USD = 122,32 USD

Резервное копирование

Примеры цен на резервное копирование см. на странице Цены на Резервное копирование AWS.

Информация о ценах на EFS см. на странице Цены на Amazon EFS.

Если не указано иное, представленные здесь цены не включают применимые налоги и сборы, в том числе НДС и применимый налог с продаж. Для клиентов с платежным адресом в Японии использование сервисов AWS облагается потребительским налогом Японии. Подробнее.

Приведенный ниже пример решения иллюстрирует совокупную стоимость владения Amazon EFS и эффективную совокупную стоимость владения Amazon EFS с учетом эластичности пропускной способности и хранилища. При использовании Amazon EFS объем хранилища и пропускная способность автоматически масштабируются вверх и вниз, то есть вам не придется оплачивать неиспользуемое хранилище или пропускную способность. EFS автоматически реплицирует данные в нескольких зонах доступности, чтобы обеспечить высокую доступность и надежность, а также автоматически распределяет данные по горячим и холодным классам хранилища для оптимизации затрат.

В свою очередь, неэластичное (выделенное) облачное решение требует сохранять емкость хранилища и пропускную способность на уровне пикового использования, не допуская их сокращения. Большинство поставщиков выделенных решений рекомендуют поддерживать коэффициент использования хранилища на уровне 30–50 %, чтобы учитывать возможный рост объема хранилища, и коэффициент использования пропускной способности на уровне 50 % на случай резких увеличений нагрузки. Если сравнить с этим эластичную моделью EFS, которая не требует постоянно поддерживать неиспользуемый объем хранилища или пропускную способность, фактическая совокупная стоимость владения окажется на 60 % ниже.

Пример 1. Рабочая нагрузка общего назначения
Предположим, что у вас есть файловая система в регионе «Восток США (Северная Вирджиния)» со средним размером хранилища 2,7 ТБ за рассматриваемый месяц. Ваше приложение выполняет несколько операций чтения с максимальной пропускной способностью 25 МБ/с, в общей сложности передавая в течение месяца 300 ГБ данных.

При использовании EFS это приложение будет хранить в среднем 5 % объема данных (145 ТБ) на твердотельных накопителях, около 20 % (527 ТБ) в хранилище для нечастого доступа, а остальные 2027 ТБ – в архиве, и в этом сценарии общие затраты на хранение составят 68,47 USD. Кроме того, за рабочую нагрузку переноса холодных данных в хранилища классов Infrequent Access и Archive взимается плата в размере 2,50 USD, а стоимость передачи 300 ГБ данных из хранилища класса Elastic Throughput составит 14,00 USD. Таким образом, совокупная стоимость владения составляет 0,0315 USD за гигабайт в месяц.

При использовании выделенного облачного решения приложение может получить преимущество от сжатия и других оптимизаций хранилища, которые позволят уменьшить общий размер хранилища на 50 % (до 1350 ТБ). Исходя из реальных данных об использовании, мы ожидаем, что примерно 5 % горячих данных (68 ТБ) будет храниться на твердотельных накопителях. Поскольку это выделенное облачное решение, которое не может автоматически масштабироваться вверх или вниз, мы рекомендуем использовать около 50 % объема хранилища, то есть выделить объем 136 ТБ. Оставшиеся 95 % объема данных (1282 ТБ) находятся в хранилище более холодного класса, а значит стоимость хранения составит 90,15 USD. Кроме того, в соответствии с рекомендацией не использовать более 50 % пропускной способности, мы выделяем пропускную способность в размере 50 МБ/с и в итоге совокупная стоимость владения составит 0,0797 USD за гигабайт в месяц.

 

 

EFS

Выделенное решение

Хранилище

   

Средний общий объем хранилища (ГБ-мес.)

2700

2700

Средний общий объем оплачиваемого хранилища (ГБ-мес.)

2700

*1350

Хранилище на базе твердотельных накопителей (ГБ-мес.)

145

**136

Хранилище нечастого доступа (ГБ-мес.)

527

**1282

Архивное хранилище (ГБ-мес.)

2027

0

SSD‑хранилище (USD/мес.)

43,55 USD

34,00 USD

Хранилище «холодных» данных (USD/мес.)

8,70 USD

56,15 USD

Архивное хранилище (USD/мес.)

16,22 USD

 

Общая стоимость хранения

68,47 USD

90,15 USD

     

Многоуровневое хранение данных

2,50 USD

 

 

 

 

Пропускная способность сети

   

Выделенная пропускная способность (Мбит/с)

 

***50

Общий объем переданных данных (ГБ)

300

 

Стоимость пропускной способности

14,00 USD

125,00 USD

     
     
     

Общая стоимость

84,97 USD

215,15 USD

Эффективная стоимость в USD/ГБ

0,0315 USD

0,0797 USD

Экономия в сценарии EFS (%)

60 %


*Предполагается, что сжатие и другая оптимизация позволят сократить используемый объем хранилища на 50 %

**Предполагается, что 5 % сжатых данных хранятся на твердотельных накопителях, которые выделяются из расчета загрузки на 50 % и тарифицируются по ставке 0,25 USD за гигабайт в месяц. Оставшиеся 95 % сжатых данных хранятся в хранилище более холодного класса по ставке 0,0483 USD за гигабайт в месяц.
***Предполагается, что пропускная способность выделяется из расчета загрузки на 50 % по ставке 2,50 USD за Мбит/с.

 

 

Пример 2. Рабочая нагрузка с временными данными

Предположим, что ваша рабочая нагрузка по моделированию фондового рынка выполняет аналитические расчеты по два часа в день и требует сохранять эфемерные данные в течение этих двух часов работы. Для этого в течение двух часов используется файловая система в регионе «Восток США (Северная Вирджиния)» с SSD-накопителем со средним размером 1024 ГБ. Ваше приложение выполняет несколько операций чтения и записи с пиковой пропускной способностью 500 МБ/с, а общий объем передаваемых данных составляет 175 ГБ в день.

При использовании EFS это приложение будет хранить данные на твердотельном накопителе в течение 60 часов в месяц (2 часа в день × 30 дней) и передавать 5250 ГБ данных, в результате чего общая стоимость составит 222,48 USD в месяц.

При использовании выделенного облачного решения файловая система может воспользоваться преимуществами сжатия и другой оптимизации хранилища, что позволит снизить используемый объем хранилища на 50 %, но для поддержки пикового объема придется настроить дополнительный буфер в размере 30 % от объема данных (1024 ГБ × сжатие 50 % + буфер 30 % = 666 ГБ), в результате чего общая стоимость составит 1416,50 USD в месяц.

Благодаря эластичности EFS вы оплачиваете только реально используемые ресурсы, и совокупная стоимость владения снижается на 84 %.

 

 

EFS

Выделенное решение

Хранилище

   

Общий объем хранилища (ГБ-мес)

1024

***666

Количество часов хранения на SSD в месяц

*60

720

Ежемесячная стоимость хранения на SSD (USD в месяц)

25,60 USD

166,50 USD

 

 

 

Пропускная способность сети

   

Выделенная пропускная способность (Мбит/с)

 

500

Передача данных в месяц (ГБ)

5250

 

Стоимость пропускной способности

**196,88 USD

1250,00 USD

     
     
     

Общая стоимость

222,48 USD

1416,50 USD

Эффективная стоимость в USD/ГБ

0,2172 USD

1,3822 USD

Экономия в сценарии EFS (%)

84 %


* Предполагается, что данные в EFS хранятся по 2 часа в день в течение 30 дней.

** Предполагается, что стоимость эластичной пропускной способности составляет 0,0375 USD за гигабайт переданных данных

*Предполагается, что сжатие и другая оптимизация позволят сократить используемый объем хранилища на 50 %, а для поддержки пиковой нагрузки применяется буфер объемом в 30 % от объема данных

Доступ из сервисов AWS

Да. Вы можете получить доступ к EFS из контейнерных приложений, запускаемых Amazon ECS, с помощью типов запуска EC2 и Fargate, ссылаясь на файловую систему EFS в своем определении задачи. Инструкции по началу работы см. в документации ECS.

Да. Доступ к EFS можно получить из контейнерных приложений, запускаемых Amazon EKS, с типом запуска EC2 или Fargate, используя драйвер EFS CSI. Инструкции по началу работы см. в документации EKS.

Да. Вы можете получить доступ к EFS из функций, работающих в Lambda, ссылаясь на файловую систему EFS в настройках функции. Инструкции по началу работы см. в документации Lambda.

Да. Вы можете получить доступ к обучающим данным в EFS из заданий обучения Amazon SageMaker, ссылаясь на файловую систему EFS в запросе CreateTrainingJob. EFS также автоматически используется для домашних каталогов, созданных в SageMaker Studio.