Озера данных и аналитика в AWS
Сервисы аналитики AWS
Amazon Athena
Запросы к данным в S3 средствами SQL.
Amazon EMR
Размещенная платформа Hadoop.
Amazon Redshift
Быстрое, простое и экономичное хранение данных.
Amazon Kinesis
Анализ потоков видео и данных в режиме реального времени.
Amazon Elasticsearch Service
Запуск и масштабирование кластеров Elasticsearch.
Amazon QuickSight
Быстрый сервис бизнес-аналитики.
AWS Glue DataBrew
Ускорение очистки и нормализации данных почти на 80 %.
Amazon Managed Streaming for Apache Kafka (MSK)
Полностью управляемый сервис Apache Kafka высокой доступности и надежности
Amazon Kinesis Video Streams
Сбор, обработка и хранение видеопотоков для анализа и машинного обучения.
Amazon Kinesis Data Firehose
Подготовка и загрузка потоков данных в режиме реального времени в хранилища и инструменты аналитики.
Amazon Kinesis Data Streams
Сбор потоковых данных в любом масштабе для аналитики в режиме реального времени.
Amazon Kinesis Data Analytics
Получайте полезную аналитическую информацию путем обработки данных потоковой передачи в режиме реального времени.
Amazon S3
Объектное хранилище для хранения и извлечения любых объемов данных из любого места.
AWS Lake Formation
Создание безопасного озера данных за считаные дни.
Amazon S3 Glacier
Недорогое архивное хранилище в облаке.
AWS Backup
Централизованное резервное копирование данных по всем сервисам AWS.
AWS Glue
Подготовка и загрузка данных.
AWS Lake Formation
Создание безопасного озера данных за считаные дни.
AWS Data Exchange
Поиск и подписка на сторонние данные в облаке
Образы AWS Deep Learning AMI
Глубокое обучение на Amazon EC2.
Amazon SageMaker
Создание, обучение и развертывание моделей машинного обучения в любом масштабе.
Сервисы аналитики AWS
Категория | Примеры использования | Сервис AWS |
---|---|---|
Аналитика | Интерактивная аналитика | Amazon Athena |
Обработка больших данных | Amazon EMR | |
Хранение данных | Amazon Redshift | |
Аналитика в режиме реального времени | Amazon Kinesis Data Analytics | |
Операционная аналитика | Amazon Elasticsearch Service | |
Информационные панели и визуализация | Amazon QuickSight | |
Подготовка визуальных данных | Amazon Glue DataBrew |
|
Перемещение данных | Перемещение данных в режиме реального времени | Amazon Managed Streaming for Apache Kafka (Amazon MSK) | Amazon Kinesis Data Streams | Amazon Kinesis Data Firehose | Amazon Kinesis Data Analytics | Amazon Kinesis Video Streams | AWS Glue |
Озеро данных | Объектное хранилище | Amazon S3 | AWS Lake Formation |
Резервное копирование и архивирование | Amazon S3 Glacier | AWS Backup | |
Каталог данных |
AWS Glue | AWS Lake Formation |
|
Сторонние данные | AWS Data Exchange | |
Прогнозная аналитика и машинное обучение | Платформы и интерфейсы | Образы AWS Deep Learning AMI |
Сервисы платформы | Amazon SageMaker |
Примеры использования

Выполняйте запросы SQL и сложные аналитические запросы к структурированным и неструктурированным данным в хранилище и озере данных без необходимости их перемещения.

Быстро и легко обрабатывайте большие объемы данных в озере данных или локальной среде с целью их структурирования и изучения, а также для ведения совместной работы с ними.

Собирайте, обрабатывайте и анализируйте потоковые данные, загружайте потоки данных непосредственно в озера и хранилища данных, а также сервисы аналитики для реагирования в режиме реального времени.

Поиск, исследование, фильтрация, агрегация и визуализация данных в режиме, близком к реальному времени, для таких задач, как мониторинг приложений, анализ журналов и истории навигации по веб‑сайтам.
Клиенты

«Мы создали на основе Amazon S3 озеро данных объемом 120 ТБ с использованием более чем 1500 схем и широко применяем аналитические сервисы AWS, такие как Glue, Redshift и Athena. Нам бы не удалось эффективно вести анализ при использовании разрозненных баз и хранилищ данных. Требовалось озеро данных масштаба S3».
Бернардо Родригез
Директор по цифровым технологиям, J.D. Power









Дополнительные ресурсы
Разрабатывайте практические решения, способствующие ускоренному внедрению инициатив по модернизации средств обработки и анализа данных. AWS Data Lab – это четырехдневный интенсив, в котором участвует ваша группа разработчиков и технические специалисты AWS.
Хотите получать информацию об обучающих материалах, предстоящих событиях и других новостях, касающихся аналитических сервисов AWS?