Amazon EMR

Без труда запускайте и масштабируйте Apache Spark, Hive, Presto и другие рабочие нагрузки с большими данными

Запускайте приложения для работы с большими данными и анализируйте петабайты данных быстрее, при этом платите в два раза меньше, чем за локальные решения.

Создавайте приложения с использованием новейших платформ с открытым исходным кодом, предусматривающие возможность запуска на настраиваемых кластерах Amazon EC2, Amazon EKS, AWS Outposts или Amazon EMR Serverless.

Получайте аналитические данные значительно быстрее (возможно, вдвое быстрее) с помощью оптимизированных по производительности и совместимых с API версий Spark, Hive и Presto с открытым исходным кодом.

Легко выполняйте разработку, визуализацию и отладку приложений с помощью EMR Notebooks и знакомых инструментов с открытым исходным кодом в EMR Studio.

Как это работает

Amazon EMR – это облачная платформа больших данных для выполнения заданий обработки распределенных данных в большом масштабе, интерактивных запросов SQL и приложений машинного обучения при помощи платформ аналитики с открытым исходным кодом, например Apache Spark, Apache Hive и Presto.

Как работает Amazon EMR
 Нажмите для увеличения
Introducing EMR Serverless (2:02)
Представляем Amazon EMR Serverless
Amazon EMR Serverless – это новая функция Amazon EMR, которая обеспечивает для инженеров и аналитиков данных простоту и экономичность работы с приложениями, которые созданы с использованием таких платформ больших данных с открытым исходным кодом, как Apache Spark, Hive или Presto без необходимости настраивать, обслуживать, оптимизировать, защищать кластеры или управлять ими.
Представляем Amazon EMR Serverless
Amazon EMR Serverless – это новая функция Amazon EMR, которая обеспечивает для инженеров и аналитиков данных простоту и экономичность работы с приложениями, которые созданы с использованием таких платформ больших данных с открытым исходным кодом, как Apache Spark, Hive или Presto без необходимости настраивать, обслуживать, оптимизировать, защищать кластеры или управлять ими. EMR Serverless масштабирует вычислительные ресурсы и память в обоих направлениях в соответствии с потребностями приложения, и вы платите только за те ресурсы, которые используются вашим приложением.

Примеры использования

Анализ больших данных

Обработка данных в большом масштабе и анализ «что, если» с помощью статистических алгоритмов и прогнозных моделей для обнаружения скрытых закономерностей, взаимосвязей, рыночных тенденций и предпочтений клиентов.

Создавайте масштабируемые конвейеры данных

Извлекайте данные из различных источников, обрабатывайте их в различном масштабе и обеспечивайте доступ к ним как для приложений, так и для пользователей.

Обрабатывайте потоки данных в режиме реального времени

Анализируйте события от источников потоковой передачи данных в режиме реального времени, чтобы создавать долгосрочные и устойчивые к ошибкам конвейеры данных потоковой передачи с обеспечением высокой доступности.

Ускорение аналитики данных и внедрение машинного обучения

Анализируйте данные с помощью платформы машинного обучения с открытым исходным кодом, такой как Apache Spark MLlib, TensorFlow и Apache MXNet. Выполняйте подключение к Amazon SageMaker Studio для обучения моделей большого масштаба, анализа и отчетности.

Как начать работу

Узнайте о том, как работает Amazon EMR

Подробнее о распределении кластеров, масштабировании ресурсов, настройке высокой доступности и многом другом.

Узнайте о возможностях Amazon EMR »

Узнайте о ценах на Amazon EMR

Платите из расчета за секунду, пользуясь возможностями запускать кластеры EMR на Amazon EC2, Amazon EKS, AWS Outposts или Amazon EMR Serverless.

Подробнее о ценах на Amazon EMR »

Начало работы с Amazon EMR

Подробнее о потоковой обработке в режиме реального времени, масштабном машинном обучении и других вариантах использования EMR.

Посмотрите руководства Amazon EMR »

Подробнее об AWS