Amazon DataZone – это сервис управления информацией, посредством которого клиенты могут быстро и легко каталогизировать, обнаруживать, совместно использовать и контролировать данные AWS в локальной среде и сторонних источниках. С помощью Amazon DataZone инженеры, специалисты по обработке данных, менеджеры по продуктам, аналитики и корпоративные пользователи могут быстро получать доступ к данным на всех уровнях организации. Благодаря этому они могут обнаруживать и совместно использовать их для получения ценной аналитической информации. Администраторы и владельцы данных, контролирующие информационные активы организации, могут легко управлять доступом к данным. Amazon DataZone предоставляет встроенные рабочие процессы, которые дают возможность пользователям запрашивать доступ к данным, а их владельцам – утверждать его.
Amazon DataZone предоставляет пользователям комплексный портал управления данными, посредством которого можно каталогизировать, обнаруживать и анализировать данные в организации, а также получать к ним доступ и управлять ими. Благодаря этому они могут легко сотрудничать с инженерами по обработке данных и ИТ-администраторами, чтобы быстрее получать представление о своих данных. С помощью Amazon DataZone можно использовать активы данных в каталоге бизнес-данных Редактора запросов Amazon Redshift и Amazon Athena через веб-приложение. Благодаря этому пользователям, предпочитающим работать за пределами консоли, не нужно входить в Консоль управления AWS. Для программной настройки или интеграции с существующими процессами в Amazon DataZone опубликовано API с рекомендациями по их использованию.
С помощью Amazon DataZone можно управлять активами данных из таблиц Amazon Redshift и таблиц AWS Glue, управляемых AWS Lake Formation. Кроме того, коннекторы AWS Glue и интеграция с Amazon AppFlow дают возможность каталогизировать ресурсы из различных источников, чтобы улучшить видимость в организации. Благодаря общедоступности можно настроить в Amazon DataZone каталогизацию пользовательских активов, чтобы легко их идентифицировать.
Проекты Amazon DataZone – это группы пользователей, активов данных и аналитических инструментов на основе бизнес-сценариев. Они предоставляют пространство для совместной работы, где пользователи проекта могут сотрудничать и обмениваться данными и артефактами. Проекты защищены таким образом, чтобы доступ к данным и инструментам в рамках проекта имели только его непосредственные участники.
При развертывании проекта создаются роли Управления идентификацией и доступом AWS (IAM) на основе выбранных возможностей (например, озера данных), которые предоставляют пользователям необходимый доступ для выполнения своей работы. Проекты также обеспечивают возможность изоляции работы в одном аккаунте, а также границу безопасности (группу безопасности и роли IAM). Для работы с данными в проектах можно создавать среды. Среды создают роли IAM на основе инструментов и возможностей (например, озера данных), которые предоставляют пользователям необходимый доступ для выполнения своей работы.
Да, каталог бизнес-данных Amazon DataZone поддерживает бизнес-глоссарий. Бизнес-глоссарий похож на словарь для организации, содержащий бизнес-термины с их определениями, чтобы обеспечить использование одних и тех же определений в рамках всей организации при обнаружении и анализе данных. Кроме того, каталог бизнес-данных содержит формы метаданных для настройки, назначения или определения дополнительных метаданных активов, чтобы специалисты по обработке данных могли изучить и понять этот актив, прежде чем использовать его для анализа.
Amazon DataZone абстрагирует процесс обмена данными между производителями и потребителями данных с помощью конструктов Lake Formation. Amazon DataZone автоматизирует доступ к данным к базовым (управляемым Amazon DataZone) активам в соответствии с политиками, применяемыми издателями данных. Доступ предоставляется без привлечения администратора или перемещения данных.
Да, мы обеспечиваем поддержку API, AWS CloudFormation, Интерфейса командной строки AWS (AWS CLI) и Комплекта для облачной разработки AWS (AWS CDK). Более подробную информацию о поддерживаемых API можно найти в документации.