Файловые системы Amazon EFS распределяются по неограниченному количеству серверов хранилища, что позволяет обеспечить их эластичное масштабирование до размеров, измеряемых петабайтами, и массово-параллельный доступ к данным для инстансов Amazon EC2. Распределенная архитектура Amazon EFS позволяет избежать узких мест и ограничений, присущих традиционным файловым серверам.

Распределенная архитектура хранилища данных означает, что многопотоковые приложения и приложения, одновременно получающие доступ к данным из нескольких инстансов Amazon EC2, могут достигать достаточно высокого уровня суммарной пропускной способности и количества операций ввода-вывода в секунду (IOPS). Примерами таких приложений могут служить приложения, работающие с большими данными и аналитикой, рабочие процессы обработки мультимедийных данных, приложения управления контентом и распространения файлов через Интернет.

Кроме того, данные Amazon EFS распределяются по нескольким зонам доступности, что обеспечивает высокий уровень надежности и доступности.


В таблице ниже приведены показатели максимальной производительности и основные характеристики предлагаемых Amazon сервисов облачных хранилищ, файлового и блочного.

    Amazon EFS Amazon EBS PIOPS
Производительность Задержка на одну операцию Низкая, постоянная Самая низкая, постоянная
Уровень пропускной способности
Несколько гигабайтов в секунду Один гигабайт в секунду
Характеристики Доступность/надежность
данных
Хранятся с избыточностью в нескольких зонах доступности Хранятся с избыточностью в одной зоне доступности
Доступ От 1 до 1000 инстансов EC2 одновременно, из разных зон доступности Один инстанс EC2 в одной зоне доступности
Примеры использования Большие данные и аналитика, рабочие процессы обработки мультимедийных данных, управление контентом, распространение файлов через Интернет, домашние каталоги
Загрузочные тома, транзакционные базы данных и NoSQL, хранилища данных и системы ETL

Распределенный характер Amazon EFS позволяет достичь высокого уровня доступности, надежности и масштабируемости. Такая распределенная архитектура обеспечивает минимальные потери вычислительных ресурсов из-за малых задержек при выполнении файловых операций. Из-за низкой задержки на одну операцию общая пропускная способность обычно возрастает по мере увеличения среднего размера данных в операциях ввода/вывода, так как при увеличении объема используемых данных потери ресурсов сглаживаются. Поддержка Amazon EFS рабочих нагрузок с высокой параллельностью обработки данных (т. е. с параллельной нагрузкой, создаваемой несколькими рабочими потоками и несколькими инстансами EC2) обеспечивает высокий уровень суммарной пропускной способности и IOPS.


Amazon EFS представляет стандартный интерфейс файловой системы, который поддерживает полную семантику доступа к файловой системе. Используя NFSv4.1, можно подключить файловую систему Amazon EFS на любом инстансе Amazon EC2 на базе Linux. После подключения можно будет работать с файлами и каталогами так же, как и в локальной файловой системе. 

Amazon EFS берет на себя самую трудоемкую часть работы. В течение нескольких минут после запуска мастера создания файловой системы в Консоли Amazon EFS новая файловая система будет подключена, и можно будет начать добавлять в нее данные. Определять нужный объем ресурсов или выполнять какие-либо сложные настройки не требуется.

Amazon EFS идеально подходит, когда требуется совместное использование хранилища несколькими инстансами EC2. Amazon EFS, благодаря поддержке тысяч подключений к совместно используемой файловой системе, обеспечивает высокопроизводительный защищенный доступ для рабочих процессов, требующих возможности непротиворечивого совместного использования данных.

Amazon EFS обеспечивает высокую доступность и высокую надежность хранилища. Файловые системы Amazon EFS хранят данные и метаданные в нескольких зонах доступности в регионе, чтобы предотвратить потерю данных при отказе какого-либо одного компонента.

Файловая система Amazon EFS способна обеспечить достаточную производительность, объем IOPS и низкую задержку для широкого спектра рабочих нагрузок. С Amazon EFS производительность и скорость операций ввода-вывода изменяется вместе с ростом файловой системы, поэтому операции с файлами выполняются с одинаковой скоростью и низкими задержками. Подробную информацию см. на странице Производительность Amazon EFS.

Amazon EFS рассчитан на обеспечение высокой масштабируемости как ресурсов для хранения данных, так и пропускной способности. Сервис может масштабировать объем хранимых данных до петабайтов и обеспечивает возможность массового параллельного доступа к данным из инстансов Amazon EC2. 

Amazon EFS обеспечивает эластичность и автоматическое изменение ресурсов хранилища по мере добавления или удаления файлов, поэтому приложения всегда имеют необходимый объем хранилища. Поскольку ресурсы эластичны, нет необходимости в их предварительном выделении, а оплате подлежат только используемые ресурсы. 

Amazon EFS обеспечивает эффективное шифрование файловых систем EFS. Данные прозрачно шифруются при записи и прозрачно дешифруются во время чтения, поэтому не приходится изменять код приложений. Ключи шифрования управляются сервисом AWS Key Management Service (KMS), что исключает необходимость создания и поддержки инфраструктуры безопасного управления ключами. Для получения дополнительной информации о шифровании данных файловой системы см. документацию пользователя.

Amazon EFS – это полностью управляемый сервис, обеспечивающий совместный доступ к файлам и не требующий установки дополнительного аппаратного или стороннего программного обеспечения, а также управления таковым. Amazon EFS обеспечивает все это без сложного администрирования, конфигурирования или текущего обслуживания. 

Для копирования существующих данных в Amazon EFS можно выбрать один из нескольких вариантов. AWS Direct Connect обеспечивает выделенное сетевое соединение с высокой пропускной способностью и пониженными задержками, по которому можно подключать файловые системы EFS. После подключения для копирования файлов можно использовать синхронизацию файлов EFS или стандартные инструменты Linux.

Синхронизация файлов EFS обеспечивает быстрый и простой способ безопасной синхронизации существующих файловых систем с Amazon EFS с использованием существующей сети или с помощью AWS Direct Connect. Синхронизация файлов EFS также может использоваться для синхронизации данных между существующими облачными файловыми системами и Amazon EFS, что обеспечивает простую настройку и управление передачей данных.


Amazon EFS обеспечивает масштабируемость и производительность, необходимые для приложений обработки больших данных, которым требуется высокая пропускная способность вычислительных узлов, а также корректность данных контрольного считывания после записи и низкая задержка операций с файлами. 

Рабочие процессы обработки мультимедийных данных, такие как редактирование видео, студийное производство, обработка трансляций, звуковой дизайн и рендеринг, зачастую требуют выполнения действий с большими файлами, находящимися в совместно используемом хранилище. Модель строгой непротиворечивости данных совместно с высокой пропускной способностью и совместным доступом к файлам может сократить время, требуемое для выполнения этих задач, и обеспечить консолидацию нескольких локальных файловых хранилищ в одно, доступное всем пользователям хранилище.

Amazon EFS можно использовать в качестве надежной, высокопроизводительной файловой системы для систем управления контентом, которая хранит информацию для веб-сайтов, электронных изданий, архивов и других приложений, а также обеспечивает ее распространение.

Если многим пользователям организации требуется возможность доступа к общим наборам данных для совместного использования, такое хранилище предоставляет сервис Amazon EFS. С помощью сервиса Amazon EFS администратор может создать файловую систему, доступную пользователям данной организации, и установить разрешения для пользователей и групп на уровне файлов или каталогов.