AWS Glue
Находите, подготавливайте и интегрируйте данные любого масштаба
Зачем использовать AWS Glue?
Подготовка данных для получения качественных результатов является первым этапом в проектах аналитики или искусственного интеллекта. AWS Glue – бессерверный сервис, с помощью которого можно легко, быстро и экономично интегрировать данные. У вас есть возможность обнаруживать более 100 различных источников данных и подключаться к ним, управлять данными в централизованном каталоге, а также визуально создавать, запускать и отслеживать конвейеры данных для загрузки информации в озера, хранилища и хранилища озер данных. Благодаря встроенным возможностям генеративного искусственного интеллекта вы можете модернизировать задания Apache Spark и быстрее создавать их с помощью интеллектуальных средств разработки ETL и устранения неполадок в Spark.
Интегрируйте данные с помощью AWS Glue в Amazon SageMaker нового поколения
Благодаря AWS Glue в Amazon SageMaker нового поколения можно управлять рабочими нагрузками и создавать их в одном месте с помощью экономичной, бессерверной и масштабируемой интеграции данных.
Преимущества
AWS Glue автоматически масштабирует даже самые ресурсоемкие задания по обработке данных с гигабайтов до петабайт без инфраструктуры для управления, а вы платите только за использованные ресурсы.
Примеры использования
Упростите управление конвейером ETL
Избавьтесь от необходимости в управлении удаленной инфраструктурой благодаря автоматическому распределению и управлению работниками, используйте один сервис, который удовлетворит все ваши потребности по интеграции данных.
Интерактивное изучение, экспериментирование и обработка данных
Используя интерактивные сеансы AWS Glue, специалисты по работе с данными могут в интерактивном режиме изучать и подготавливать данные с использованием интегрированной среды разработки (IDE) или выбранного блокнота.
Эффективное обнаружение данных
Быстро идентифицируйте данные в AWS, локальной среде или других облаках, а затем делайте их сразу же доступными для опроса и преобразования.
Поддержка различных платформ и рабочих нагрузок для обработки
Упростите обеспечение поддержки различных платформ обработки данных, таких как ETL и ELT, и различных рабочих нагрузок, включая пакеты, микропакеты и потоки.
Новые возможности
Нашли то, что искали сегодня?
Скажите, как улучшить качество контента на наших страницах