Облако AWS

Создать бесплатный аккаунт

Для получения на основе данных важной аналитической информации, пригодной к практическому использованию, требуется широкий спектр технологий, обеспечивающих эффективную и экономичную работу с данными с возможностью масштабирования. AWS предлагает полный набор сервисов для каждого этапа обработки данных в ходе их анализа, включая хранение данных, бизнес-аналитику, пакетную обработку, потоковую обработку, машинное обучение и оркестрацию рабочих процессов. Мощность и гибкость этих сервисов сочетается с простотой использования, поэтому они позволяют легко и быстро превратить необработанные данные в рабочую информацию.

Сервис Тип продукта
Описание
Amazon Athena Бессерверный сервис запросов Анализ данных в Amazon S3 стандартными средствами SQL – легко и просто. Платите только за выполненные запросы.
Amazon EMR
Hadoop
Предоставляет управляемую инфраструктуру Hadoop для быстрой и экономичной обработки больших объемов данных. Запускайте платформы с открытым исходным кодом, такие как Apache Spark, HBase, Presto и Flink.
Amazon Elasticsearch Service Elasticsearch
Упрощает развертывание, использование и масштабирование Elasticsearch на AWS.
Amazon Kinesis Потоковая передача данных Самый простой способ работы с потоковыми данными в AWS.
Amazon QuickSight
Бизнес-аналитика
Очень быстрое и простое облачное решение для бизнес-аналитики, в десять раз дешевле традиционных решений.
Amazon Redshift
Хранилище данных Высокоскоростное, полностью управляемое, масштабируемое до петабайтов хранилище данных, которое делает анализ всех данных с помощью имеющихся инструментов бизнес-аналитики проще и дешевле.
AWS Glue Извлечение, преобразование и загрузка данных (ETL) Подготовка и загрузка данных в хранилища данных.
AWS Data Pipeline
Оркестрация рабочих процессов обработки данных Позволяет надежно и с заданными интервалами обрабатывать данные и перемещать их между различными вычислительными сервисами и сервисами хранилища AWS, а также локальными источниками данных.

Amazon Athena – интерактивный сервис запросов, позволяющий анализировать данные в Amazon S3 стандартными средствами SQL. Athena – это бессерверный сервис, поэтому не нужно управлять архитектурой, а плата начисляется только за выполненные запросы. Сервис Athena очень прост в использовании. Просто укажите данные в Amazon S3, задайте схему и выполняйте запросы, используя стандартные средства SQL. Большинство результатов готово в течение секунд. Для подготовки данных к анализу больше не нужно использовать сложные задания ETL. Таким образом, любой специалист со знанием SQL может быстро проанализировать большой объем данных.

Подробнее см. на странице сервиса Amazon Athena.


Сервис Amazon EMR помогает быстро и экономно обрабатывать большие объемы данных. Amazon EMR упрощает обработку больших данных благодаря использованию управляемой инфраструктуры Hadoop, которая просто, быстро и недорого обеспечивает распределение больших объемов данных для их обработки динамически масштабируемыми инстансами Amazon EC2. В Amazon EMR можно также запускать другие известные распределенные инфраструктуры, включая Apache Spark, Presto и HBase, и работать с данными, находящимися в других хранилищах данных AWS, таких как Amazon S3 и Amazon DynamoDB.

Подробнее см. на странице сервиса Amazon EMR.


Amazon Elasticsearch Service – это управляемый сервис, который упрощает развертывание, эксплуатацию и масштабирование Elasticsearch в облаке AWS. Elasticsearch – это популярный поисковый и аналитический движок с открытым исходным кодом, который используется для анализа журналов и навигации, а также мониторинга приложений в режиме реального времени.

Подробнее см. на странице сервиса Amazon Elasticsearch Service.


Amazon Kinesis – это платформа для работы с потоковыми данными в AWS. Она предлагает мощные сервисы, которые обеспечивают легкую загрузку и анализ потоковых данных, а также позволяет создавать свои собственные настраиваемые приложения для решения специфических задач, возникающих при обработке потоковых данных. Веб-приложения, мобильные и носимые устройства, промышленные датчики, а также различные приложения и сервисы могут формировать огромные объемы потоковых данных (иногда до нескольких терабайтов в час). Эти потоковые данные нужно непрерывно собирать, сохранять и обрабатывать. Сервисы Amazon Kinesis позволяют решать эти задачи легко и экономично.

Подробнее см. на странице сервиса Amazon Kinesis.


Amazon QuickSight – это чрезвычайно быстрый облачный сервис бизнес-аналитики, с помощью которого каждый сотрудник может легко создавать визуализации, проводить специальный анализ и быстро получать важную аналитическую информацию на основании своих данных. Для выполнения расширенных расчетов и быстрого представления визуализаций в Amazon QuickSight используется новый быстрый механизм параллельных вычислений в памяти (SPICE). Благодаря SPICE сервис Amazon QuickSight автоматически интегрируется с сервисами данных AWS, позволяет организациям масштабировать свои решения на сотни тысяч пользователей, а также быстро и эффективно обрабатывать запросы. Всего за 1/10 стоимости аналогичных традиционных решений Amazon QuickSight предоставляет широкие функциональные возможности бизнес-аналитики для всех пользователей в организации.

Подробнее см. на странице сервиса Amazon QuickSight.


Amazon Redshift – это высокоскоростное, полностью управляемое, масштабируемое до петабайтов хранилище данных, которое выполняет анализ всех данных с помощью имеющихся инструментов бизнес-аналитики проще и дешевле. Вы можете начать всего лишь с 0,25 USD за час без каких-либо обязательств и выполнять масштабирование до нескольких петабайтов по цене 1000 USD за терабайт в год. Это в десять раз меньше стоимости традиционных решений.

Подробнее см. на странице сведений об Amazon Redshift.


AWS Glue – это полностью управляемый ETL-сервис, упрощающий работу с источниками данных, подготовку данных и их надежную передачу между хранилищами.AWS Glue упрощает и автоматизирует сложные и продолжительные задачи, которые связаны с обнаружением данных, преобразованием, привязкой, а также планированием заданий.

Подробнее см. на странице сервиса AWS Glue.


AWS Data Pipeline – это сервис, помогающий надежно и с заданными интервалами обрабатывать данные и перемещать их между различными вычислительными сервисами и сервисами хранилищ AWS, а также локальными источниками данных. AWS Data Pipeline обеспечивает регулярный доступ к данным в местах хранения, преобразование и обработку данных в любых масштабах и эффективную передачу полученных результатов таким сервисам AWS, как Amazon S3, Amazon RDS, Amazon DynamoDB и Amazon EMR.

Подробнее см. на странице сервиса Amazon Data Pipeline.


Быстрое начало работы

Переход на платформу AWS обеспечил Nasdaq расширенные аналитические возможности, повышение скорости работы и сокращение затрат на 57 %. Смотреть презентацию на re:Invent »