Amazon EMR

Без труда запускайте и масштабируйте Apache Spark, Hive, Presto и другие рабочие нагрузки с большими данными

Представляем бессерверную конфигурацию EMR

Amazon EMR Serverless – это новая функция Amazon EMR, которая обеспечивает для инженеров и аналитиков данных простоту и экономичность работы с приложениями, которые созданы с использованием таких платформ больших данных с открытым исходным кодом, как Apache Spark, Hive или Presto без необходимости настраивать, обслуживать, оптимизировать, защищать кластеры или управлять ими.

Преимущества

Запускайте приложения для работы с большими данными и анализируйте петабайты данных быстрее, при этом платите в два раза меньше, чем за локальные решения.

Создавайте приложения с использованием новейших платформ с открытым исходным кодом, предусматривающие возможность запуска на настраиваемых кластерах Amazon EC2, Amazon EKS, AWS Outposts или Бессерверной конфигурации Amazon EMR.

Получайте аналитические данные значительно быстрее (возможно, вдвое быстрее) с помощью оптимизированных по производительности и совместимых с API версий Spark, Hive и Presto с открытым исходным кодом.

Легко выполняйте разработку, визуализацию и отладку приложений с помощью Блокнотов EMR и знакомых инструментов с открытым исходным кодом в Студии EMR.

Примеры использования

Обработка данных в большом масштабе и анализ «что, если» с помощью статистических алгоритмов и прогнозных моделей для обнаружения скрытых закономерностей, взаимосвязей, рыночных тенденций и предпочтений клиентов.
Извлекайте данные из различных источников, обрабатывайте их в различном масштабе и обеспечивайте доступ к ним как для приложений, так и для пользователей.
Анализируйте события от источников потоковой передачи данных в режиме реального времени, чтобы создавать долгосрочные и устойчивые к ошибкам конвейеры данных потоковой передачи с обеспечением высокой доступности.
Анализируйте данные с помощью платформы машинного обучения с открытым исходным кодом, такой как Apache Spark MLlib, TensorFlow и Apache MXNet. Выполняйте подключение к Amazon SageMaker Studio для обучения моделей большого масштаба, анализа и отчетности.

Подробнее об AWS