Озера данных и аналитика в AWS

Ваши пользователи смогут в кратчайшие сроки получить необходимые ответы в результате анализа всего массива данных
Самый простой способ создания озер данных и аналитических решений
При настройке озер данных и управлении ими приходится вручную выполнять множество трудоемких задач, таких как загрузка, преобразование и защита данных, а также контроль за доступом к ним. Благодаря AWS Lake Formation можно автоматизировать многие из этих ручных операций и сократить сроки создания эффективных озер данных с нескольких месяцев до нескольких дней.
Масштабирование и экономичность
Объемы данных растут в геометрической прогрессии, как и затраты на их хранение и анализ. AWS предлагает комплексный набор инструментов для управления стоимостью хранения и анализа любых данных в нужном масштабе, включая такие функции, как Intelligent Tiering для многоуровневого хранения данных в S3, и возможности, помогающие снизить стоимость вычислений, например автомасштабирование, тарифы Savings Plan и интеграция со спотовыми инстансами EC2.
Универсальность и доступность
Мы предлагаем наиболее обширный и проработанный ассортимент специализированных аналитических инструментов, с помощью которых можно быстро получать результаты по данным, выбирая наилучший инструмент для каждой задачи. Все наши аналитические сервисы поддерживают открытые форматы файлов, например Apache Parquet, поэтому данные не придется перемещать и преобразовывать для анализа. Вместо этого можно хранить их в стандартном формате и проводить анализ с помощью наиболее подходящих инструментов или технологий.
Надежная аналитическая инфраструктура
Обеспечение безопасности огромных объемов данных – одна из сложнейших задач для многих организаций. Кроме ожидаемых от AWS сертификатов и рекомендаций, мы предлагаем функции обеспечения безопасности, которые помогут вам соблюдать политики и отраслевые требования. Например, AWS Lake Formation обеспечивает точный контроль доступа к данным в нескольких сервисах, Amazon Macie помогает обнаружить конфиденциальные данные, которые по ошибке хранятся в неправильном месте, а Amazon Inspector помогает выявлять ошибки конфигурации, которые могут привести к утечкам данных.

Сервисы аналитики AWS

Категория
Примеры использования
Сервис AWS
Аналитика
Интерактивная аналитика

Amazon Athena

Запросы к данным в S3 средствами SQL.

Обработка больших данных

Amazon EMR

Размещенная платформа Hadoop.

Хранение данных

Amazon Redshift

Быстрое, простое и экономичное хранение данных.

Аналитика в режиме реального времени

Amazon Kinesis

Анализ потоков видео и данных в режиме реального времени.

Операционная аналитика

Amazon Elasticsearch Service

Запуск и масштабирование кластеров Elasticsearch.

Информационные панели и визуализация

Amazon QuickSight

Быстрый сервис бизнес-аналитики.

Перемещение данных
Перемещение данных в режиме реального времени

Amazon Managed Streaming for Apache Kafka (MSK)

Полностью управляемый сервис Apache Kafka высокой доступности и надежности

Amazon Kinesis Video Streams

Сбор, обработка и хранение видеопотоков для анализа и машинного обучения.

Amazon Kinesis Data Firehose

Подготовка и загрузка потоков данных в режиме реального времени в хранилища и инструменты аналитики.

Amazon Kinesis Data Streams

Сбор потоковых данных в любом масштабе для аналитики в режиме реального времени.

Amazon Kinesis Data Analytics

Получайте полезную аналитическую информацию путем обработки данных потоковой передачи в режиме реального времени.

Озеро данных
Объектное хранилище

Amazon S3

Объектное хранилище для хранения и извлечения любых объемов данных из любого места.

AWS Lake Formation

Создание безопасного озера данных за считаные дни.

Резервное копирование и архивирование

Amazon S3 Glacier

Недорогое архивное хранилище в облаке.

AWS Backup

Централизованное резервное копирование данных по всем сервисам AWS.

Каталог данных

AWS Glue

Подготовка и загрузка данных.

AWS Lake Formation

Создание безопасного озера данных за считаные дни.

Сторонние данные

AWS Data Exchange

Поиск и подписка на сторонние данные в облаке

Прогнозная аналитика и машинное обучение
Платформы и интерфейсы

Образы AWS Deep Learning AMI

Глубокое обучение на Amazon EC2.

Сервисы платформы

Amazon SageMaker

Создание, обучение и развертывание моделей машинного обучения в любом масштабе.

Сервисы аналитики AWS

Категория Примеры использования Сервис AWS
Аналитика Интерактивная аналитика Amazon Athena
Обработка больших данных Amazon EMR
Хранение данных Amazon Redshift
Аналитика в режиме реального времени Amazon Kinesis Data Analytics
Операционная аналитика Amazon Elasticsearch Service
Информационные панели и визуализация Amazon QuickSight
Перемещение данных Перемещение данных в режиме реального времени Amazon Managed Streaming for Apache Kafka (Amazon MSK) | Amazon Kinesis Data Streams | Amazon Kinesis Data Firehose | Amazon Kinesis Data Analytics | Amazon Kinesis Video Streams | AWS Glue
Озеро данных Объектное хранилище Amazon S3 | AWS Lake Formation
Резервное копирование и архивирование Amazon S3 Glacier | AWS Backup
Каталог данных
AWS Glue | AWS Lake Formation
Сторонние данные AWS Data Exchange
Прогнозная аналитика и машинное обучение Платформы и интерфейсы Образы AWS Deep Learning AMI
Сервисы платформы Amazon SageMaker

Примеры использования

Page-Illo_Data-warehousing
Хранение данных

Выполняйте запросы SQL и сложные аналитические запросы к структурированным и неструктурированным данным в хранилище и озере данных без необходимости их перемещения.

Попробовать Amazon Redshift »
Page-Illo_Big-data-processing
Обработка больших данных

Быстро и легко обрабатывайте большие объемы данных в озере данных или локальной среде с целью их структурирования и изучения, а также для ведения совместной работы с ними.

Попробовать Amazon EMR »
Page-Illo_Real-time-analytics
Анализ в режиме реального времени

Собирайте, обрабатывайте и анализируйте потоковые данные, загружайте потоки данных непосредственно в озера и хранилища данных, а также сервисы аналитики для реагирования в режиме реального времени.

Попробовать Amazon MSK » Попробовать Amazon Kinesis »
Page-Illo_Data-visualization
Операционная аналитика

Поиск, исследование, фильтрация, агрегация и визуализация данных в режиме, близком к реальному времени, для таких задач, как мониторинг приложений, анализ журналов и истории навигации по веб‑сайтам.

Попробовать Amazon Elasticsearch Service »

Клиенты

JD-Power_Logo_@1x

«Мы создали на основе Amazon S3 озеро данных объемом 120 ТБ с использованием более чем 1500 схем и широко применяем аналитические сервисы AWS, такие как Glue, Redshift и Athena. Нам бы не удалось эффективно вести анализ при использовании разрозненных баз и хранилищ данных. Требовалось озеро данных масштаба S3».

Бернардо Родригез
Директор по цифровым технологиям, J.D. Power

netflix
Chick-fil-A_Logo
3M Company_Logo
280x100_Georgia-Pacific_Logo
Pinterest_Customer-Reference_Logo
TMobile_Logo_@1x
gt-customer_landing_page_graphics166x_epic
Adobe_Customer-Reference_Logo
Pfizer
Посмотреть всех клиентов »

Дополнительные ресурсы

AWS Data Lab

Разрабатывайте практические решения, способствующие ускоренному внедрению инициатив по модернизации средств обработки и анализа данных. AWS Data Lab – это четырехдневный интенсив, в котором участвует ваша группа разработчиков и технические специалисты AWS.

Подробнее »

Информационная рассылка

Хотите получать информацию об обучающих материалах, предстоящих событиях и других новостях, касающихся аналитических сервисов AWS?

Подпишитесь на информационную рассылку AWS по аналитике »