Узнайте, как с помощью сервисов AWS проектировать и создавать бессерверные решения для озер данных, а также обеспечивать их работу

Building a Serverless Data Lake – однодневный прикладной курс для продвинутых пользователей, в котором разъясняется, как с помощью сервисов AWS можно проектировать и создавать бессерверные решения для озер данных, а также обеспечивать их работу. В прикладной курс входят такие темы, как импорт данных из любого источника в больших масштабах, безопасное и надежное хранение данных, обеспечение возможности использовать необходимые инструменты для обработки больших объемов данных и понимание доступных вариантов анализа данных в режиме, близком к реальному времени.

Уровень

Расширенный

Форма проведения

С преподавателем, очное занятие

Продолжительность

1 день

Этот курс включает следующие темы.

  • Сбор больших объемов данных с помощью таких сервисов, как Kinesis Streams и Firehose, а также безопасное и надежное хранение данных в сервисе Amazon Simple Storage Service.
  • Создание индекса метаданных для озера данных.
  • Выбор оптимального инструмента для подачи, хранения, обработки и анализа данных в озере.
  • Применение знаний в ходе практикумов, предлагающих практический опыт с построением комплексного решения.
     

Этот курс предназначен для:

  • архитекторов решений;
  • разработчиков, работающих с большими данными;
  • архитекторов и аналитиков данных;
  • прочих прикладных специалистов по работе с данными.

Для прохождения данного курса рекомендуется иметь следующую подготовку.

  • Хорошие практические знания основных сервисов AWS, в том числе Amazon Elastic Compute Cloud (EC2) и Amazon Simple Storage Service (S3).
  • Базовый опыт работы с языком программирования или скриптов.
  • Знание операционной системы Linux и интерфейса командной строки.
  • Для выполнения практических заданий потребуется ноутбук (планшеты не поддерживаются).

Этот курс включает следующие формы обучения.

  • Курс с преподавателем
  • Практикумы

Курс охватывает следующие темы.

  • Основные сервисы, позволяющие использовать бессерверную архитектуру озер данных.
  • Решение для анализа данных, связанное с рабочим процессом подачи, хранения, обработки и анализа.
  • Воспроизводимое развертывание шаблонов для реализации озера данных.
  • Создание индекса метаданных и обеспечение возможности поиска.
  • Настройка крупномасштабного конвейера поглощения входных данных из множественных источников
  • Преобразование данных с помощью простых функций, запускаемых событиями
  • Обработка данных за счет выбора оптимальных инструментов и сервисов для конкретного сценария использования.
  • Доступные варианты для улучшения анализа обработанных данных.
  • Рекомендации по развертыванию и эксплуатации.
Перейти на aws.training