Чтобы начать использовать AWS Glue, просто войдите в Консоль управления AWS и перейдите в раздел «Glue», который расположен в категории «Analytics». Можно воспользоваться одним из наших пошаговых учебных пособий, в котором рассмотрен пример использования сервиса AWS Glue.

Дополнительную информацию о сервисе AWS Glue см. в документации.

Образцы ETL-кода также можно найти в репозитории GitHub Glue samples (раздел «AWS Labs»). Загрузить ETL-библиотеку Python для сервиса Glue можно по ссылке.

Приведенные ниже видео и публикации в блогах помогут максимально эффективно использовать AWS Glue.

Готовы начать свой процесс ETL?

Начало работы с AWS Glue

glue-video-what-is-glue
4:25
Что такое AWS Glue?
glue-video-data-catalog
5:25
Начало работы с каталогом данных AWS Glue
glue-video-etl
6:23
Начало работы с ETL-заданиями AWS Glue
glue-video-reinvent-abd315
50:52
AWS re:Invent 2017. Building Serverless ETL Pipelines with AWS Glue (ABD315)
glue-video-reinvent-abd213
30:38
AWS re:Invent 2017. How to Build a Data Lake with AWS Glue Data Catalog (ABD213-R)
glue-dark-data-webinar2
36:33
Tackle Your Dark Data Challenge with AWS Glue. Вебинары AWS Tech Talk, 2017 г.
glue-video-webinar-serverless
36:52
Serverless Analytics – Amazon Redshift Spectrum, AWS Glue, and Amazon QuickSight

Analyze Amazon Connect records with Amazon Athena, AWS Glue, and Amazon QuickSight | 1 июня 2018 г. | Луис Каро Перес и Питер Дальбханьян

Analyze Apache Parquet optimized data using Amazon Kinesis Data Firehose, Amazon Athena, and Amazon Redshift | 11 мая 2018 г. | Рой Хассон

Use AWS Glue to run ETL jobs against non-native JDBC data sources | 10 мая 2018 г. | Капил Шардха и Уильям Торреальба

Implement continuous integration and delivery of serverless AWS Glue ETL applications using AWS Developer Tools | 20 апреля 2018 г. | Прасад Алле и Луис Каро Перес

Work with partitioned data in AWS Glue | 19 апреля 2018 г. | Бен Соуэлл и Мохит Саксена

How to retain system tables’ data spanning multiple Amazon Redshift clusters and run cross-cluster diagnostic queries | 12 апреля 2018 г. | Картик Сонти

Easily manage table metadata for Presto running on Amazon EMR using the AWS Glue Data Catalog | 10 марта 2018 г. | Радхика Равирала

AWS Glue Now Supports Scala Scripts | 12 января 2018 г. | Мегул Шах, Бен Соуэлл и Винай Вавили

Simplify Querying Nested JSON with the AWS Glue Relationalize Transform | 14 декабря 2017 г. | Тревор Робертс

Using Amazon Redshift Spectrum, Amazon Athena, and AWS Glue with Node.js in Production | 27 ноября 2017 г. | Рафи Тон

Visualize AWS CloudTrail Logs using AWS Glue and Amazon Quicksight | 10 ноября 2017 г. | Луис Каро Перес

Build a Data Lake Foundation with AWS Glue and Amazon S3 | 27 октября 2017 г. | Гордон Хайнрих

Building a Serverless Analytics Solution for Cleaner Cities | 14 сентября 2017 г. | Ральф Винзингер и Пратим Дас

Unite Real-Time and Batch Analytics Using the Big Data Lambda Architecture, Without Servers! | 8 сентября 2017 г. | Лайт Аль-Саадун

Harmonize, Query, and Visualize Data from Various Providers using AWS Glue, Amazon Athena, and Amazon QuickSight | 16 августа 2017 г. | Бен Снайвли

Upsert into Amazon Redshift using AWS Glue and SneaQL | 14 августа 2017 г. | Джереми Уинтерс и Риту Мишра

Launch – AWS Glue Now Generally Available | 14 августа 2017 г. | Рэндол Хант


Начать работу с AWS Glue очень просто. Просто войдите в Консоль управления AWS и перейдите в раздел «Glue», который расположен в категории «Analytics»

Готовы начать свой процесс ETL?

Начало работы с AWS Glue