Fast Crypto Lab – это научно-исследовательская группа в составе Национального университета Тайваня. Она занимается разработкой и анализом эффективных алгоритмов решения важных математических задач, а также развитием и реализацией этих алгоритмов в массово-параллельных вычислительных системах.

Перед тем, как зарегистрироваться в Amazon Web Services (AWS), группа использовала частное облако и запускала Hadoop на собственных машинах. Профессор Чен-Моу Ченг, научный руководитель Fast Crypto Lab, объясняет, почему группа перешла в AWS: «Понятный и гибкий интерфейс позволяет легко начать работу в AWS. Amazon Elastic Compute Cloud (Amazon EC2) предоставляет простой метод определения расходов при решении задач различного характера. Для сходных и повторяющихся проблем сервис Amazon EC2 можно также использовать в качестве метрики сравнения альтернатив или конкурирующих алгоритмов и их реализаций».

Чен-Моу добавляет: «При использовании Amazon EC2 в качестве метрики возможность параллелизации алгоритма или конкретной реализации принимается во внимание явным образом, в отличие от вариантов, когда эта возможность предполагается или вовсе не учитывается. Поэтому Amazon EC2 просто и легко использовать в качестве метрики».

В настоящее время группа использует в своей архитектуре Hadoop Streaming и запускает программы с помощью Amazon Elastic MapReduce (Amazon EMR) и инстансов кластера GPU для Amazon EC2.

«Наша цель – побить рекорд в решении задачи поиска кратчайшего вектора (SVP) в евклидовой решетке, – заявляет Чен-Моу. – Эта задача играет важную роль в области теории информации. По нашим оценкам, нам должно было потребоваться 1000 часов работы инстанса cg1.4xlarge. Кончилось тем, что мы для решения задачи использовали 50 инстансов cg1.4xlarge в течение 10 часов. Теперь найденные нами векторы считаются самыми строго определенными SVP, найденными до сих пор. Мы потратили всего 2300 USD на использование 100 вычислительных модулей Tesla M2050 в течение 10 часов, это совсем не дорого».

После перехода в AWS группа обнаружила, что расходы на обслуживание компьютеров уменьшились, а в распоряжении исследователей оказались более стабильные и масштабируемые вычислительные мощности. Любимый компонент группы в AWS – это Amazon CloudWatch, используемый для отслеживания вычислительных средств, а также для улучшения рабочей программы.

О будущем Чен-Моу говорит так: «Мы хотим увеличить нашу квоту на кластеры GPU и решить задачу SVP большего масштаба. Мы также рассматриваем вопрос аренды у AWS отдельной машины для настройки сервера SVN».

Подробнее о том, как AWS может помочь в хранении и обработке больших данных, см. на странице сведений о больших данных: http://aws.amazon.com/big-data/.