Озера данных и аналитика в AWS

Ваши пользователи смогут в кратчайшие сроки получить необходимые ответы в результате анализа всего массива данных
Самый простой способ создания озер данных и аналитических решений
При настройке озер данных и управлении ими приходится вручную выполнять множество трудоемких задач, таких как загрузка, преобразование и защита данных, а также контроль за доступом к ним. Благодаря AWS Lake Formation можно автоматизировать многие из этих ручных операций и сократить сроки создания эффективных озер данных с нескольких месяцев до нескольких дней.
Масштабирование и экономичность
Объемы данных растут в геометрической прогрессии, но затраты на их хранение и анализ не могут расти в том же темпе. AWS предлагает комплексный набор инструментов для управления стоимостью хранения и анализа любых данных в нужном масштабе, включая такие функции, как Intelligent Tiering для многоуровневого хранения данных в S3, и возможности, помогающие снизить стоимость вычислений, например автомасштабирование и интеграция со спотовыми инстансами EC2.
Универсальность и доступность
Мы предлагаем наиболее обширный и проработанный ассортимент специализированных аналитических инструментов, с помощью которых можно быстро получать результаты по данным, выбирая наилучший инструмент для каждой задачи. Все наши аналитические сервисы поддерживают открытые форматы файлов, например Apache Parquet, поэтому данные не придется перемещать и преобразовывать для анализа. Вместо этого можно хранить их в стандартном формате и проводить анализ с помощью наиболее подходящих инструментов или технологий.
Надежная аналитическая инфраструктура
Обеспечение безопасности огромных объемов данных – одна из сложнейших задач для многих организаций. Кроме ожидаемых от AWS сертификатов и рекомендаций, мы предлагаем функции обеспечения безопасности, которые помогут вам соблюдать рекомендации и отраслевые требования. Например, Amazon Macie помогает обнаружить конфиденциальные данные, которые по ошибке хранятся в неправильном месте, а Amazon Inspector помогает выявлять ошибки конфигурации, которые могут привести к утечкам данных.

Сервисы аналитики AWS

Категория
Примеры использования
Сервис AWS
Аналитика
Интерактивная аналитика

Amazon Athena

Запросы к данным в S3 средствами SQL.

Обработка больших данных

Amazon EMR

Размещенная платформа Hadoop.

Хранение данных

Amazon Redshift

Быстрое, простое и экономичное хранение данных.

Аналитика в режиме реального времени

Amazon Kinesis

Анализ потоков видео и данных в режиме реального времени.

Операционная аналитика

Amazon Elasticsearch Service

Запуск и масштабирование кластеров Elasticsearch.

Информационные панели и визуализация

Amazon QuickSight

Быстрый сервис бизнес-аналитики.

Перемещение данных
Перемещение данных в режиме реального времени

Amazon Kinesis Video Streams

Сбор, обработка и хранение видеопотоков для анализа и машинного обучения.

Amazon Kinesis Data Firehose

Подготовка и загрузка потоков данных в режиме реального времени в хранилища и инструменты аналитики.

Amazon Kinesis Data Streams

Сбор потоковых данных в любом масштабе для аналитики в режиме реального времени.

Amazon Kinesis Data Analytics

Сбор полезной аналитической информации путем обработки потоковых данных в режиме реального времени.

Озеро данных
Объектное хранилище

Amazon S3

Объектное хранилище для хранения и извлечения любых объемов данных из любого места.

AWS Lake Formation

Создание безопасного озера данных за считаные дни.

Резервное копирование и архивирование

Amazon S3 Glacier

Недорогое архивное хранилище в облаке.

AWS Backup

Централизованное резервное копирование данных по всем сервисам AWS.

Каталог данных

AWS Glue

Подготовка и загрузка данных.

AWS Lake Formation

Создание безопасного озера данных за считаные дни.

Сторонние данные

AWS Data Exchange

Поиск и подписка на сторонние данные в облаке

Прогнозная аналитика и машинное обучение
Платформы и интерфейсы

Образы AWS Deep Learning AMI

Глубокое обучение на Amazon EC2.

Сервисы платформы

Amazon SageMaker

Создание, обучение и развертывание моделей машинного обучения в любом масштабе.

Сервисы аналитики AWS

Категория Примеры использования Сервис AWS
Аналитика Интерактивная аналитика Amazon Athena
Обработка больших данных Amazon EMR
Хранение данных Amazon Redshift
Аналитика в режиме реального времени Amazon Kinesis
Операционная аналитика Amazon Elasticsearch Service
Информационные панели и визуализация Amazon QuickSight
Перемещение данных Перемещение данных в режиме реального времени Amazon Kinesis Data Analytics | Amazon Kinesis Data FirehoseAmazon Kinesis Data Streams | Amazon Kinesis Video Streams 
Озеро данных Объектное хранилище Amazon S3 | AWS Lake Formation
Резервное копирование и архивирование Amazon S3 Glacier | AWS Backup
Каталог данных
AWS Glue | AWS Lake Formation
Сторонние данные AWS Data Exchange
Прогнозная аналитика и машинное обучение Платформы и интерфейсы Образы AWS Deep Learning AMI
Сервисы платформы Amazon SageMaker

Примеры использования

Page-Illo_Data-warehousing
Хранение данных

Выполнение запросов SQL и сложных аналитических запросов к структурированным и неструктурированным данным без необходимости их перемещения.

Попробовать Amazon Redshift »
Page-Illo_Big-data-processing
Обработка больших данных

Простая и быстрая обработка больших объемов данных для их структуризации и изучения, а также для ведения совместной работы с ними.
 

Попробовать Amazon EMR »
Page-Illo_Real-time-analytics
Анализ в режиме реального времени

Сбор, обработка и анализ потоковых данных по мере поступления в озеро данных и реагирование в режиме реального времени.
 

Попробовать Amazon Kinesis »
Page-Illo_Data-visualization
Операционная аналитика

Поиск, исследование, фильтрация, агрегация и визуализация данных в режиме, близком к реальному времени, для таких задач, как мониторинг приложений, анализ журналов и истории навигации по веб‑сайтам.

Попробовать Amazon Elasticsearch Service »

Клиенты

JD-Power_Logo_@1x

«Мы создали на основе Amazon S3 озеро данных объемом 120 ТБ с использованием более чем 1500 схем и широко применяем аналитические сервисы AWS, такие как Glue, Redshift и Athena. Нам бы не удалось эффективно вести анализ при использовании разрозненных баз и хранилищ данных. Требовалось озеро данных масштаба S3».

Бернардо Родригез
Директор по цифровым технологиям, J.D. Power

Посмотреть всех клиентов »
netflix
Chick-fil-A_Logo
3M Company_Logo
280x100_Georgia-Pacific_Logo
Pinterest_Customer-Reference_Logo
TMobile_Logo_@1x
gt-customer_landing_page_graphics166x_epic
Adobe_Customer-Reference_Logo
Pfizer

Дополнительные ресурсы

AWS Data Lab

AWS Data Lab – это четырехдневный интенсив, в котором участвует группа разработчиков клиента и технические специалисты AWS. Цель мероприятия – разработка практических решений, способствующих ускоренному внедрению инициатив по модернизации средств обработки и анализа данных.

Подробнее »

Информационная рассылка

Хотите получать информацию об обучающих материалах, предстоящих событиях и других новостях, касающихся аналитических сервисов AWS?

Подпишитесь на информационную рассылку AWS по аналитике »