Перейти к главному контенту

Что такое переносимость данных (перенос данных)?

Переносимость данных – это возможность перемещать данные между двумя системами по своему усмотрению. Современные предприятия предъявляют различные требования к хранению и доступу к данным в зависимости от сценария использования, географического расположения, нормативных требований и ожиданий клиентов. Переносимость данных позволяет организациям при необходимости передавать данные между поставщиками облачных услуг и локальными системами, обеспечивая наилучшее соответствие этим требованиям.

Почему переносимость данных важна?

Ранее устаревшие системы навязывали клиентам использование проприетарных форматов данных и лицензионных ограничений, фактически привязывая их к конкретным решениям. Это создает технические сложности при перемещении данных, увеличивает затраты и приводит к зависимости от поставщика. Без реализованной переносимости данные организации могут быть доступны только через платформу, на которой они хранятся. Такой изолированный подход может привести к недоступности данных и снижению их качества.

Преимущества переносимости данных перечислены далее.

Обеспечивает доступность данных для аналитики

Переносимость данных устраняет разрозненность хранилищ и обеспечивает беспрепятственный поток данных из разных систем в единое центральное хранилище. Создавая единый источник достоверной информации, компании упрощают аналитикам доступ к данным. Кроме того, аналитики могут использовать широкий набор инструментов для бизнес-аналитики (BI), машинного обучения (МО) и искусственного интеллекта (ИИ), чтобы получать аналитические данные и предоставлять инсайты другим подразделениям компании в режиме реального времени.

Обеспечивает соответствие нормативным требованиям Закона штата Калифорния о защите прав потребителей и GDPR

Статья 20 Общего регламента ЕС по защите данных (GDPR) закрепляет за каждым человеком право на переносимость данных. А Закон штата Калифорния о защите прав потребителей (CCPA) требует, чтобы организации внедряли системы, позволяющие переносить данные между различными хранилищами, устраняя ненужные «островки данных» и способствуя демократизации данных.

Эти законы обеспечивают выполнение требований к переносимости данных, предоставляя субъектам данных и другим заинтересованным сторонам контроль над своей информацией.

Улучшает управление качеством данных

Переносимость данных подразумевает создание системы, в которой все данные могут свободно перемещаться внутри организации и поступать в единый источник достоверной информации. Такой подход позволяет внедрять проверки качества данных, включая валидацию, дедупликацию и маркировку метаданных. Эти практики помогают устранить дублирующиеся, некорректные или устаревшие данные и гарантируют, что в центральное хранилище поступают только актуальные, полные и качественные данные.

Как реализуется переносимость данных?

Компании применяют несколько стратегий для реализации требований по переносимости данных.

Открытые форматы данных

Существует ряд непатентованных форматов, которые упрощают переносимость данных: JSON (JavaScript Object Notation), XML (Extensible Markup Language), Parquet и CSV (Comma-Separated Values). Эти форматы широко поддерживаются хранилищами данных и платформами бизнес-аналитики, что облегчает интеграцию и позволяет аналитикам эффективно работать с наборами данных. При ответе на запросы о переносимости персональных данных всегда предоставляйте и передавайте данные в одном из этих открытых форматов.

Свобода выбора клиентов

Компании могут реализовать переносимость данных, используя решения, которые предоставляют пользователям полный контроль над своими данными. Ниже приведены несколько основных принципов, которым стоит следовать организациям при построении таких систем.

  • Клиенты полностью владеют своими данными, включая всю информацию, полученную с устройств Интернета вещей (IoT), данные о местоположении, данные с носимых устройств, а также данные, формируемые при взаимодействии с бизнесом.
  • Клиенты могут хранить контент в любом выбранном ими формате.
  • Они самостоятельно определяют географические регионы для хранения своих данных – эти настройки не изменяются, если только клиент сам не запросит передачу персональных данных в другое место.
  • Клиенты могут в любое время загрузить или удалить свои данные.

Предоставление клиентам полного контроля над их данными обеспечивает возможность свободно менять поставщиков услуг и перемещать данные без затруднений.

Обеспечение совместимости

Использование совместимых форматов, которые позволяют без модификации перемещать данные между различными системами и сетями, повышает уровень переносимости данных. Совместимые системы должны использовать стандартизированные интерфейсы прикладного программирования (API) и подключения, обеспечивающие беспрепятственное перемещение данных.

Кроме того, применение стандартных протоколов передачи данных, таких как Server Message Block (SMB), Network File System (NFS), HyperText Transfer Protocol Secure (HTTPS) и SSH File Transfer Protocol (SFTP), способствует безопасной и надежной передаче данных.

Каковы наилучшие методы обеспечения переносимости данных?

Существует множество стратегий, которые компании могут применять для поддержания переносимости данных и эффективного выполнения запросов пользователей на перенос данных.

Изучите свои данные

Глубокое понимание типов и форматов данных, используемых в компании, источников их поступления, мест хранения и способов обработки способствует выбору оптимальных систем передачи данных. Обладая полной прозрачностью всех данных в вашей системе, вы сможете лучше подготовиться к внедрению решений для переносимости данных и обеспечить их полноту и согласованность.

Внедрите автоматизацию

Автоматизация процессов передачи данных заставляет разработчиков использовать стандартизированные форматы и протоколы, что упрощает реализацию этих процессов между разными системами. Автоматизированная система позволяет:

  • сократить трудозатраты, связанные с обеспечением переносимости данных;
  • повысить согласованность и целостность данных;
  • упростить миграцию данных между системами;
  • улучшить работу систем передачи данных.

Централизуйте управление данными

Фреймворки управления данными определяют, каким образом организация управляет и использует хранимые данные. Централизованное управление данными помогает обеспечить единообразие политик, прозрачность процессов и соблюдение требований по безопасности и соответствию нормативам. Эффективное управление данными обеспечивает эффективную переносимость данных, обеспечивая отслеживаемость, мобильность и соответствие требованиям.

Обеспечьте управление качеством данных

Изучайте любые проблемы с качеством данных, чтобы найти их первопричину. В процессах проверки или преобразования данных может произойти ошибка, которая затем приведет к более серьезным проблемам в системе управления данными. Решая эти проблемы управления качеством данных, вы можете сохранить целостность данных и обеспечить бесперебойную мобильность всей вашей системы данных.

Как AWS поддерживает ваши требования к переносимости данных?

Предоставление клиентам свободы выбора – один из ключевых принципов AWS. Наши клиенты всегда сохраняют право собственности и полный контроль над своими данными, включая место хранения, способ хранения и управление доступом. AWS предлагает широкий спектр типов баз данных, каждая из которых оптимально подходит для различных категорий данных. У клиентов нет договорных обязательств использовать только один тип базы данных. Получите описанные далее возможности.

  • Запускать базы данных сторонних поставщиков на AWS.
  • Изменять тип экземпляра, на котором работает база данных, в любое время.
  • Экспортировать свои данные из AWS.

Все решения AWS направлены на то, чтобы предоставить клиентам свободу выбора наиболее подходящих облачных сервисов и функций.

AWS предлагает широкий набор инструментов и подробно задокументированных методов для поддержки миграции данных в AWS и из AWS. Наши сервисы построены на основе открытых стандартов, таких как SQL, Linux и Xen. Ниже приведены несколько примеров.

  • AWS Direct Connect для частного подключения центра обработки данных с помощью сетевого канала непосредственно к виртуальному частному облаку (VPC) в регионе AWS
  • AWS DataSync для копирования или репликации данных файловой системы в Amazon S3 или Amazon EFS
  • Шлюз хранилища AWS (файловый шлюз) для подключения локальных приложений к облачному хранилищу файлов в виде объектов Amazon S3;
  • Шлюз хранилища AWS (ленточный шлюз) для подключения существующих локальных приложений к облачному хранилищу для резервного копирования на ленточные накопители
  • Шлюз хранилища AWS (шлюз томов) для подключения существующих локальных приложений к облачному хранилищу блочных томов
  • AWS Database Migration Service для быстрого и безопасного переноса баз данных в AWS с минимальным временем простоя
  • Amazon S3 Transfer Acceleration для чтения и записи данных в Amazon S3 на больших географических расстояниях
  • Amazon Data Firehose для сбора и обработки нескольких источников потоковых данных.

API Amazon Data Portability позволяют пользователям получать доступ к своим персональным данным и экспортировать их из сервисов Amazon в машиночитаемом формате. Они дают разработчикам возможность создавать инструменты, облегчающие безопасное извлечение и передачу пользовательских данных, обеспечивающие прозрачность, контроль пользователей и соблюдение правил конфиденциальности данных.

Начните работу с переносимостью данных в AWS, создав бесплатную учетную запись уже сегодня.