Бессерверная интеграция данных – AWS Glue

AWS Glue

Находите, подготавливайте и интегрируйте данные любого масштаба

Зачем использовать AWS Glue?

Подготовка данных для получения качественных результатов является первым этапом в проектах аналитики или искусственного интеллекта. AWS Glue – бессерверный сервис, с помощью которого можно легко, быстро и экономично интегрировать данные. У вас есть возможность обнаруживать более 100 различных источников данных и подключаться к ним, управлять данными в централизованном каталоге, а также визуально создавать, запускать и отслеживать конвейеры данных для загрузки информации в озера данных, хранилища данных и хранилища в озерах данных. Благодаря встроенным возможностям генеративного искусственного интеллекта вы можете модернизировать задания Apache Spark и быстрее создавать их с помощью интеллектуальных средств разработки ETL и устранения неполадок в Spark.

Интегрируйте данные с помощью AWS Glue в Amazon SageMaker нового поколения

Благодаря AWS Glue в Amazon SageMaker нового поколения можно управлять рабочими нагрузками и создавать их в одном месте с помощью экономичной, бессерверной и масштабируемой интеграции данных.

Подробнее

Преимущества

AWS Glue предоставляет все необходимые средства для интеграции данных, чтобы вы могли быстро получать аналитические сведения и применять данные на практике. Кроме того, AWS Glue – это полностью управляемый бессерверный набор инструментов для проектирования и автоматизации современных конвейеров данных со встроенным ETL, обнаружением схем и интеграцией между различными сервисами.

AWS Glue автоматически масштабирует даже самые ресурсоемкие задачи по обработке данных – от гигабайт до петабайт – без необходимости управления инфраструктурой. Кроме того, вы платите только за использованные ресурсы.

AWS Glue исключает управление инфраструктурой, предоставляя бессерверные конвейеры данных со встроенными возможностями планирования и мониторинга, что позволяет командам сосредоточиться на создании рабочих процессов обработки данных, а не на обслуживании серверов.

Получайте помощь на основе искусственного интеллекта на протяжении всего процесса интеграции данных: от автоматической генерации кода ETL до модернизации заданий Spark. AWS Glue обеспечивает интеллектуальную генерацию кода, обновления Spark с помощью искусственного интеллекта и встроенные средства устранения неполадок Spark.

Интегрируйте данные, где бы они не находились, с помощью быстрого и простого подключения к источникам данных в Amazon SageMaker нового поколения. Создайте проект по обработке данных с помощью AWS Glue, Amazon Athena, Amazon EMR и MWAA (все это в Amazon SageMaker) и воспользуйтесь преимуществами единой среды для управления и мониторинга. Возможности обработки данных AWS Glue доступны в блокнотах Amazon SageMaker и визуальном инструменте ETL Amazon SageMaker.

Примеры использования

Упрощение управления конвейером ETL

Избавьтесь от необходимости в управлении удаленной инфраструктурой благодаря автоматическому распределению рабочих процессов и управлению ими, используйте один сервис, который удовлетворит все ваши потребности по интеграции данных.

Подробнее об автомасштабировании AWS Glue

Интерактивное изучение, экспериментирование и обработка данных

Используя интерактивные сеансы AWS Glue, специалисты по работе с данными могут в интерактивном режиме изучать и подготавливать данные с использованием интегрированной среды разработки (IDE) или выбранного блокнота.

Подробнее об интерактивных сеансах AWS Glue

Эффективное обнаружение данных

Быстро идентифицируйте данные в AWS, локальной среде или других облаках, а затем делайте их сразу же доступными для опроса и преобразования.

Подробнее о каталоге данных AWS Glue

Поддержка различных платформ и рабочих нагрузок для обработки

Упростите обеспечение поддержки различных платформ обработки данных, таких как ETL и ELT, и различных рабочих нагрузок, включая пакеты, микропакеты и потоки.

Подробнее о потоковой передаче заданий ETL