Вопросы и ответы об Amazon DataZone

Вопрос. Каковы главные компоненты сервиса Amazon DataZone?

Amazon DataZone состоит из четырех основных компонентов:

  • Каталог для всей организации. Сделайте данные видимыми в контексте бизнеса, чтобы каждый мог быстро найти и изучить их. Каталогизируйте данные по всей организации, чтобы вы могли найти их для анализа и запросить доступ к ним.
  • Рабочий процесс публикации и подписки с управлением доступом. Используйте автоматизированный рабочий процесс, чтобы защитить данные между производителями и потребителями и обеспечить доступ к необходимым данным нужным пользователям для достижения соответствующих целей. Оптимизируйте аудит того, кто использует те или иные наборы данных для решения бизнес-задач, с помощью рабочего процесса публикации и подписки.
  • Проекты данных. Упростите доступ к аналитике AWS за счет создания групп пользователей, активов данных и аналитических инструментов на основе бизнес-пользователей. Проекты Amazon DataZone – это пространство для совместной работы, где участники проекта могут сотрудничать, обмениваться данными и артефактами. Проекты предоставляют доступ к данным и инструментам аналитики только специально добавленным пользователям. Индивидуальные проекты обеспечивают управление правом собственности на активы данных в этом проекте, созданные в соответствии с политиками, применяемыми распорядителями данных, что позволяет децентрализовать право собственности на данные посредством федеративного управления.
  • Портал (за пределами Консоли управления AWS). Портал Amazon DataZone – это интегрированный интерфейс для работы пользователей с данными, способствующий исследованию и стимулированию инноваций с помощью персонализированной домашней страницы. Портал представляет собой среду вне консоли, способствующую многофункциональному сотрудничеству при работе с данными и аналитическими инструментами в режиме самообслуживания. Он использует существующие учетные данные от вашего поставщика идентификационных данных.

Вопрос. Какой вид каталога представляет собой каталог Amazon DataZone?

Amazon DataZone представляет каталог бизнес-метаданных. Бизнес-метаданные содержат информацию, созданную или используемую бизнесменами, и контекст организационных данных. Сюда может входить следующая информация:

  • Право собственности: современные организации, ориентированные на данные, используют распределенный процесс управления данными, в рамках которого владельцы бизнеса отвечают за управление своими собственными данными. Каталог отслеживает это право собственности, чтобы заинтересованные стороны могли найти данные и запросить доступ к ним в рамках своих бизнес-задач.
  • Классификация: обнаружение данных – ключевая задача, с которой могут справиться бизнес-метаданные. Обнаружение данных использует централизованно определенные корпоративные онтологии и таксономии для классификации источников данных и позволяет находить соответствующие объекты данных.
  • Отношения: можно использовать каталог данных Amazon DataZone для добавления информации о взаимоотношениях в виде метаданных. Как и в случае со схемой набора технических данных, каталог бизнес-метаданных показывает отношения между объектами в каталоге, например между базами данных, наборами данных и их столбцами.

Вопрос. Что такое домены Amazon DataZone?

С помощью доменов вы можете более надежно организовать ресурсы в соответствии с бизнес-ориентированными доменами, такими как LOB. Домен – это набор объектов Amazon DataZone, таких как активы данных, проекты, связанные аккаунты AWS и источники данных. Домены представляют собой масштабируемый контейнер для вас, вашей команды и связанных с Amazon DataZone структур, включая активы данных и аналитические инструменты, такие как Amazon Athena и редакторы запросов Amazon Redshift. Вы можете опубликовать актив данных в каталоге с определенным доменом, который управляет данными. Затем вы можете контролировать доступ к связанным с ними аккаунтам AWS и ресурсам, которые могут получить доступ к этому домену. Домены служат механизмом укрепления организационной дисциплины в командах, создающих и каталогизирующих данные в каталоге бизнес-данных. Можно опубликовать ресурс данных из каталога в определенном домене, который управляет данными, и контролировать потребителей, имеющих доступ к домену. В домене может быть несколько проектов, основанных на бизнес-сценариях использования, в которых люди сотрудничают.

Вопрос. Как Amazon DataZone поддерживает другие сервисы AWS и взаимодействует с ними?

Amazon DataZone поддерживает три типа интеграции с другими сервисами AWS:

  • Источники данных производителей: вы можете публиковать активы данных в каталоге Amazon DataZone из данных, хранящихся в Каталоге данных AWS Glue и таблицах и представлениях Amazon Redshift. Пути и объекты Amazon S3 (например, изображения и каталоги) можно также вручную публиковать в каталоге Amazon DataZone.
  • Инструменты для пользователей: для доступа к ресурсам данных и их анализа можно использовать Amazon Athena или Редактор запросов Amazon Redshift версии 2.
  • Контроль доступа и гранты: Amazon DataZone поддерживает предоставление доступа к управляемым AWS Lake Formation таблицам AWS Glue и таблицам и представлениям Amazon Redshift. Для всех ресурсов данных Amazon DataZone публикует в Amazon EventBridge стандартные события, связанные с вашими действиями (например, одобрение запроса на подписку). Если Amazon DataZone не поддерживает управление доступом к определенному ресурсу данных, вы можете использовать эти стандартные события для предоставления доступа (например, управляемые IAM таблицы Glue и пути Amazon S3). Вы можете использовать эти стандартные события для интеграции с другими сервисами AWS или сторонними решениями для пользовательских интеграций.

Вопрос. Что такое портал Amazon DataZone?

Amazon DataZone предоставляет аналитикам данных единый портал управления данными, позволяющий обнаруживать данные в организации, получать к ним доступ, готовить, анализировать и составлять отчеты по ним. Благодаря порталу аналитики могут легко сотрудничать с инженерами по обработке данных и ИТ-администраторами, чтобы получить представление о своих данных. С Amazon DataZone пользователи могут работать с ресурсами данных из каталога бизнес-метаданных из редакторов запросов Amazon Redshift и Athena. Вы используете активы данных в веб-приложении, что устраняет необходимость входа в консоль AWS для пользователей, предпочитающих работать вне консоли.

Вопрос. В каких регионах доступен ознакомительный режим?

В ознакомительном режиме корневой домен Amazon DataZone может быть создан только в таких регионах AWS, как Восток США (Северная Вирджиния), Запад США (Орегон) или Европа (Ирландия). Центр идентификации AWS IAM, являющийся преемником сервиса «Единый вход AWS», должен быть настроен в том же регионе AWS, что и корневой домен. Данные из любого из этих регионов можно публиковать в каталоге Amazon DataZone. Пользователи могут подписаться на данные и использовать их в том же регионе, что и данные в аналитических сервисах AWS, таких как Amazon Redshift и Athena.

Contact us to join the program
Узнайте о ценах на Amazon DataZone

Ознакомьтесь со всеми вариантами цен.

Подробнее »
Зарегистрируйте бесплатный аккаунт AWS
Зарегистрируйте бесплатный аккаунт

Получите мгновенный доступ к уровню бесплатного пользования AWS.

Регистрация »
Практикумы по Amazon Redshift
Начните разработку в консоли

Начните разработку с помощью Amazon DataZone в Консоли управления AWS.

Войти »