Аналитика в AWS

Ваши пользователи смогут в кратчайшие сроки получить необходимые ответы в результате анализа всего массива данных
Масштабируемые озера данных
У десятков тысяч клиентов работают озера данных на AWS. На сегодняшний день настройка озер данных и управление ими подразумевает выполнение вручную множества трудоемких задач. AWS Lake Formation автоматизирует эти задачи, благодаря чему на создание и защиту озера данных уходят считаные дни вместо нескольких месяцев. Хранилище озера данных лучше всего создать в Amazon S3 ввиду непревзойденной надежности «11 девяток», доступности 99,99 %, наилучшей защите, соответствию требованиям, возможностям аудита с ведением журнала на уровне объектов, контролю доступа, максимальной гибкости за счет пяти уровней хранения и самой низкой стоимости – стартовая цена ниже 1 USD за ТБ в месяц.
Специальные сервисы аналитики
AWS предоставляет самый широкий и функциональный ассортимент специальных сервисов аналитики, оптимизированных для уникальных примеров использования аналитики. Все эти сервисы являются лучшими в своем классе, поэтому вам не придется искать компромисс между производительностью, масштабированием и стоимостью во время их использования. Например, Amazon Redshift в 3 раза быстрее и обходится по меньшей мере на 50 % дешевле других облачных хранилищ данных. Spark на Amazon EMR работает в 1,7 раза быстрее, чем стандартный Apache Spark 3.0, позволяя анализировать петабайты данных со вдвое меньшими затратами, чем при использовании традиционных локальных решений.
Беспрепятственное перемещение данных
Поскольку объемы данных в озерах и специальных хранилищах продолжают расти, часто возникает необходимость легко переместить их часть в другое хранилище. AWS упрощает объединение, перемещение и репликацию данных между многочисленными хранилищами и озером данных. Например, AWS Glue предоставляет полный набор возможностей для интеграции данных, благодаря которому можно легко обнаруживать, подготавливать и объединять данные для аналитики, машинного обучения и разработки приложений, тогда как Amazon Redshift поможет быстро отправлять данные запросов в озеро данных на базе S3. Ни один другой поставщик услуг аналитики не может обеспечить такое удобное перемещение больших объемов данных туда, где они нужнее всего.
Объединенное управление
Один из важнейших элементов современной архитектуры аналитики – это возможность клиентов разрешать доступ к данным, управлять им и проводить его аудит. Это может быть непростой задачей, поскольку управление безопасностью, контроль доступа и аудит всех хранилищ данных в организации часто сопровождаются сложностями и ошибками, а также занимают много времени. Такие возможности, как централизованный контроль доступа и политики, а также фильтрация данных на уровне столбцов, обеспечивают централизованное управление доступом ко всем данным озера и специальным хранилищам. Ни один другой поставщик средств аналитики не предоставляет такие функции.
Производительность и экономичность
AWS обеспечивает наилучшую производительность при самой низкой стоимости всех аналитических сервисов. Мы постоянно внедряем инновации, чтобы улучшить соотношение цены и производительности наших сервисов. Помимо лучшего в отрасли соотношения цены и производительности аналитических сервисов, S3 за счет интеллектуального разделения на уровни помогает клиентам сэкономить до 70 % на хранении данных в озере, а Amazon EC2 предоставляет доступ более чем к 200 самых популярных в отрасли типов инстансов, обеспечивает пропускную способность сети до 100 Гбит/с и дает возможность выбирать между предоставляемыми по требованию, зарезервированными и спотовыми инстансами.

Сервисы аналитики AWS

Категория
Примеры использования
Сервис AWS
Аналитика
Интерактивная аналитика

Amazon Athena

Запросы к данным в S3 средствами SQL.

Обработка больших данных

Amazon EMR

Размещенная платформа Hadoop.

Хранение данных

Amazon Redshift

Быстрое, простое и экономичное хранение данных.

Аналитика в режиме реального времени

Amazon Kinesis

Анализ потоков видео и данных в режиме реального времени.

Операционная аналитика

Amazon Elasticsearch Service

Запуск и масштабирование кластеров Elasticsearch.

Информационные панели и визуализация

Amazon QuickSight

Быстрый сервис бизнес-аналитики.

Подготовка визуальных данных

AWS Glue DataBrew

Ускорение очистки и нормализации данных почти на 80 %.

Перемещение данных
Перемещение данных в режиме реального времени

Amazon Managed Streaming for Apache Kafka (MSK)

Полностью управляемый сервис Apache Kafka высокой доступности и надежности

Amazon Kinesis Video Streams

Сбор, обработка и хранение видеопотоков для анализа и машинного обучения.

Amazon Kinesis Data Firehose

Подготовка и загрузка потоков данных в режиме реального времени в хранилища и инструменты аналитики.

Amazon Kinesis Data Streams

Сбор потоковых данных в любом масштабе для аналитики в режиме реального времени.

Озеро данных
Объектное хранилище

Amazon S3

Объектное хранилище для хранения и извлечения любых объемов данных из любого места.

AWS Lake Formation

Создание безопасного озера данных за считаные дни.

Резервное копирование и архивирование

Amazon S3 Glacier

Недорогое архивное хранилище в облаке.

AWS Backup

Централизованное резервное копирование данных по всем сервисам AWS.

Каталог данных

AWS Glue

Подготовка и загрузка данных.

AWS Lake Formation

Создание безопасного озера данных за считаные дни.

Сторонние данные

AWS Data Exchange

Поиск и подписка на сторонние данные в облаке

Прогнозная аналитика и машинное обучение
Платформы и интерфейсы

Образы AWS Deep Learning AMI

Глубокое обучение на Amazon EC2.

Сервисы платформы

Amazon SageMaker

Создание, обучение и развертывание моделей машинного обучения в любом масштабе.

Сервисы аналитики AWS

Категория Примеры использования Сервис AWS
Аналитика Интерактивная аналитика Amazon Athena
Обработка больших данных Amazon EMR
Хранение данных Amazon Redshift
Аналитика в режиме реального времени Amazon Kinesis Data Analytics
Операционная аналитика Amazon Elasticsearch Service
Информационные панели и визуализация Amazon QuickSight
Подготовка визуальных данных Amazon Glue DataBrew
Перемещение данных Перемещение данных в режиме реального времени Amazon Managed Streaming for Apache Kafka (Amazon MSK) | Amazon Kinesis Data Streams | Amazon Kinesis Data Firehose | Amazon Kinesis Video Streams | AWS Glue
Озеро данных Объектное хранилище Amazon S3 | AWS Lake Formation
Резервное копирование и архивирование Amazon S3 Glacier | AWS Backup
Каталог данных
AWS Glue | AWS Lake Formation
Сторонние данные AWS Data Exchange
Прогнозная аналитика и машинное обучение Платформы и интерфейсы Образы AWS Deep Learning AMI
Сервисы платформы Amazon SageMaker

Примеры использования

Page-Illo_Data-warehousing
Хранение данных

Выполняйте запросы SQL и сложные аналитические запросы к структурированным и неструктурированным данным в хранилище и озере данных без необходимости их перемещения.

Попробовать Amazon Redshift »
Page-Illo_Big-data-processing
Обработка больших данных

Быстро и легко обрабатывайте большие объемы данных в озере данных или локальной среде с целью их структурирования и изучения, а также для ведения совместной работы с ними.

Попробовать Amazon EMR »
Page-Illo_Real-time-analytics
Анализ в режиме реального времени

Собирайте, обрабатывайте и анализируйте потоковые данные, загружайте потоки данных непосредственно в озера и хранилища данных, а также сервисы аналитики для реагирования в режиме реального времени.

Попробовать Amazon MSK » Попробовать Amazon Kinesis »
Page-Illo_Data-visualization
Операционная аналитика

Поиск, исследование, фильтрация, агрегация и визуализация данных в режиме, близком к реальному времени, для таких задач, как мониторинг приложений, анализ журналов и истории навигации по веб‑сайтам.

Попробовать Amazon Elasticsearch Service »

Клиенты

JD-Power_Logo_@1x

«Мы создали на основе Amazon S3 озеро данных объемом 120 ТБ с использованием более чем 1500 схем и широко применяем аналитические сервисы AWS, такие как Glue, Redshift и Athena. Нам бы не удалось эффективно вести анализ при использовании разрозненных баз и хранилищ данных. Требовалось озеро данных масштаба S3».

Бернардо Родригез
Директор по цифровым технологиям, J.D. Power

netflix
Chick-fil-A_Logo
3M Company_Logo
280x100_Georgia-Pacific_Logo
Pinterest_Customer-Reference_Logo
TMobile_Logo_@1x
Epic Games
Equinox.svg
Adobe_Customer-Reference_Logo
Pfizer
Посмотреть всех клиентов »

Дополнительные ресурсы

AWS Data Lab

Разрабатывайте практические решения, способствующие ускоренному внедрению инициатив по модернизации средств обработки и анализа данных. AWS Data Lab – это четырехдневный интенсив, в котором участвует ваша группа разработчиков и технические специалисты AWS.

Подробнее »