Вопрос. Что такое эластичный HPC-кластер?

Эластичный кластер обеспечивает среду высокопроизводительных вычислений, которая очень похожа на среду традиционного кластера, но отличается возможностями масштабирования: задачи поступают через очередь, узлы запускаются по мере необходимости, задачи запускаются автоматически на освобождающихся узлах, узлы автоматически отключаются, когда потребность в них исчезает.

Вопрос. Каковы преимущества использования Amazon Web Services для высокопроизводительных вычислений?

AWS обеспечивает эластичность. Вместо того чтобы платить много и сразу, вы платите только за то, что используете. Если вы запускаете основной кластер на 1000 узлов на один день, вы и платите за один день. Более того, при использовании облачного кластера в вашем распоряжении всегда новейшее оборудование, а каждый кластер можно настраивать под запускаемые на нем приложения. Многие клиенты AWS запускают и отключают кластеры высокопроизводительных вычислений каждый день. AWS работает в разных географических регионах, в каждом из которых представлено множество зон доступности, и в каждой зоне доступности находится один или несколько ЦОД. Это предоставляет клиентам AWS доступ к практически неограниченному объему вычислительных ресурсов в любой точке мира.

Вопрос. Какие есть варианты запуска HPC-приложений на AWS?

Работу на AWS поддерживают многие коммерческие решения для высокопроизводительных вычислений, равно как и решения с открытым исходным кодом. Многие клиенты начинают с AWS ParallelCluster, а затем меняют свои программные решения в зависимости от конкретных требований. Некоторые пользователи предпочитают развертывать вычислительные инстансы вручную или с помощью собственных скриптов, которые вызывают API EC2 через интерфейс командной строки AWS. Для каких-то пользователей лучше всего подходят полностью управляемые SaaS-решения. Все эти варианты доступны и используются клиентами AWS. 

Вопрос. Что такое AWS ParallelCluster?

AWS ParallelCluster – это инструмент для создания и запуска шаблонов AWS CloudFormation. Это приложение на Python, которое вызывает сервисы AWS, включая Amazon EC2, Amazon EBS и Amazon S3. Оно также использует Amazon SQS, Amazon DynamoDB, Amazon CloudWatch и AWS CloudFormation для мониторинга и обслуживания кластера. Дополнительные сведения см. в документации по AWS ParallelCluster

Вопрос. Каковы преимущества использования AWS ParallelCluster для запуска HPC-приложений?

AWS ParallelCluster обеспечивает оперативный доступ к среде кластера с помощью ряда инструментов для разработчиков, общего диска и набора ПО для планирования, работы с инстансами и мониторинга. AWS ParallelCluster управляет очередью запросов к ПО множества пользователей. Более того, среды, развернутые с помощью AWS ParallelCluster, полностью настроены для запуска MPI-приложений с использованием расширенных сетевых возможностей AWS.

Вопрос. Сколько стоит ПО AWS ParallelCluster?

CfnCluster – это бесплатное решение с открытым исходным кодом, разработанное AWS.

Вопрос. Сколько будут стоить ресурсы AWS в моем HPC-кластере?

В стоимость развертывания системы AWS входит стоимость основного инстанса, вычислительных узлов, томов EBS и используемого хранилища Amazon S3. Подробнее рассказано в разделе Используемые сервисы и цены.

Вопрос. Что делать, если приложению требуется другая конфигурация инфраструктуры? Насколько сложно экспериментировать с AWS ParallelCluster?

AWS ParallelCluster отлично подходит для экспериментов, так как любой кластер можно без труда перенастроить в зависимости от текущих требований. Для файла конфигурации pcluster можно настроить систему контроля версий и документировать изменения в каждом эксперименте. Если нужна оптимальная производительность по минимальной цене, AWS ParallelCluster поможет протестировать разные аспекты конфигурации кластеров, такие как тип инстанса, ОС и хранилище данных.