Перейти к главному контенту

Что такое миграция данных?

Миграция данных – это перемещение данных из одной системы хранения или вычислительной среды в другую. Организации собирают и хранят данные для анализа. Им приходится перемещать данные между системами для интегрированной визуализации, из-за технологических изменений или из-за желания перенести операции в облако. Цель миграции данных – переместить данные эффективно и быстро, не нарушая работу бизнес-процессов. Сюда входит планирование с учетом таких факторов, как сетевые ресурсы, безопасность данных, а также время и способы передачи. При миграции данных также может потребоваться учитывать архитектуру хранения в случаях отсутствия значений данных или изменения их типов.

Почему миграция данных важна?

Данные организации хранятся в физических хранилищах, на локальных или виртуальных серверах, на отдельных машинах и в различных приложениях. Они также хранятся во многих форматах и типах. Миграция данных становится необходимой для повышения удобства использования данных при одновременном повышении эффективности управления данными и их хранения. Перенос данных в облако открывает множество новых преимуществ для организаций.

Внедрение современной архитектуры приложений

Перенос данных в облако закладывает основу для развертывания приложений в облаке. Можно модернизировать устаревшие системы и перестроить их в облачные приложения, использующие микросервисы, контейнеризацию, бессерверную среду и другие современные решения. Модернизация приложений повышает гибкость и ускоряет инновации.

Снижение затрат на хранение

Миграция в облако помогает организациям избежать высоких затрат на обслуживание локальной инфраструктуры. В облачном хранилище вы платите только за то, что используете, и можете увеличивать или уменьшать объем ресурсов в зависимости от потребностей. Оно также очень экономично для таких случаев использования, как архивирование, резервное копирование и восстановление данных.

Повышение безопасности данных

Облако включает такие возможности, как шифрование, контроль доступа, ведение журналов, мониторинг и автоматическое реагирование на инциденты. Для обеспечения безопасности организациям достаточно настроить средства защиты в облаке и не требуется развертывать всю сетевую инфраструктуру и программное обеспечение, которые в противном случае необходимы для соблюдения нормативных требований к данным. При необходимости вы также можете хранить конфиденциальные данные в определенных географических регионах.

Улучшение аналитики

Облачные хранилища данных позволяют интегрировать данные из нескольких источников в централизованную среду. Они позволяют быстро настроить проверки качества данных и получение данных в реальном времени, необходимые для современных сценариев использования. Вы также получаете встроенный доступ к сервисам искусственного интеллекта и машинного обучения и можете быстро добавлять интеллектуальные возможности в аналитику.

Какие существуют типы миграции данных?

Данные переносятся из одной исходной системы в другую целевую систему. Архитектура этих систем и причина перемещения данных определяют тип вашего проекта миграции данных.

Миграция хранилища

Миграция хранилища включает передачу данных между системами хранения данных для повышения производительности, масштабируемости или экономической эффективности. Типичный пример – перенос файлов с локального файлового сервера на базе NTFS в облачное хранилище, такое как Amazon S3. Миграция хранилища часто является одним из первых шагов внедрения облачных технологий, поскольку она позволяет организациям перемещать большие объемы документов, медиафайлов, резервных копий и журналов в облако без доработки имеющихся приложений. Главные преимущества:

  • Сокращение расходов на обслуживание оборудования
  • Упрощенный доступ к данным из любой точки
  • Повышенная отказоустойчивость благодаря встроенным функциям облачной репликации и управления версиями.

Миграция баз данных

Миграция баз данных означает передачу данных между системами баз данных. Она предполагает переход от локальных баз данных к облачным решениям. Например, компания может перенести свою базу данных SQL Server из собственного центра обработки данных в облачный сервис реляционных баз данных, такой как Amazon RDS. Обычно этот процесс включает преобразование данных, репликацию и настройку производительности в целевой среде.

Основными факторами миграции баз данных являются надежность и снижение затрат. Облачные базы данных обеспечивают автоматическое резервное копирование, высокую доступность, возможность независимого масштабирования вычислительных ресурсов и хранилища.

Миграция приложений

Миграция приложений включает перенос целых программных приложений и связанных с ними данных из локального центра обработки данных в облако. Хорошим примером может служить перенос устаревшего программного обеспечения базы данных ERP на облачную версию того же приложения или на новую платформу SaaS. Этот процесс может потребовать изменения платформы или даже перестройки приложения для использования оптимизированных для облака возможностей.

Преимущества миграции приложений включают повышение производительности, упрощение обновлений и интеграцию с другими облачными сервисами. Организации могут модернизировать свой технологический стек и улучшать пользовательский интерфейс за счет повышения скорости и доступности.

Миграция бизнес-процессов

Миграция бизнес-процессов переносит в облако операционную деятельность и рабочие процессы, поддерживающие бизнес-функции. Например, компания может перевести свои операции по обслуживанию клиентов с сочетания ручных процессов и локальных инструментов CRM на облачное CRM-решение. Часто это требует переноса данных, логики и точек интеграции, которые обеспечивают работу ключевых бизнес-функций.

Мотивом для такого типа миграции обычно является стратегия компании – стремление повысить гибкость, ускорить процесс принятия решений и улучшить качество обслуживания клиентов. Размещая эти процессы в облачной среде, компании получают доступ к данным в реальном времени и более эффективно автоматизируют задачи.

Какие существуют стратегии миграции данных?

Далее мы приведем несколько стратегий, которые можно использовать для переноса данных.

Перенос в облако

Перенос в облако – самый простой способ миграции данных. Используя его, вы транспортируете данные и храните их в другом месте, не меняя их формат. Хотя эта стратегия эффективна, она может оказаться менее полезной при переносе в облако. Хранение данных в одном формате часто не помогает эффективно использовать преимущества облачного хранилища.

Использование уже существующих инструментов

Множество программных инструментов помогают организациям успешно выполнить миграцию. Эти инструменты поставщиков и инструменты с открытым исходным кодом облегчают миграцию корпоративных данных с точки зрения управления.

Например, AWS DataSync – это сервис Amazon Web Services (AWS). Он помогает организациям перенести локальные общие файловые системы, объектные хранилища или кластеры Hadoop в решения для облачного хранения AWS.

Перемещение всего сразу или поэтапно

В зависимости от данных можно перемещать все данные сразу или поэтапно. Например, можно разделить большой объем данных и выполнять перенос фрагментов в ночное время в течение нескольких недель. Хотя переносить все данные за один раз проще и быстрее, иногда это просто невозможно.

Привлечение специалистов

Для сложных миграций целесообразно обратиться за помощью к сторонним экспертам. При переносе данных на AWS вы можете связаться с одним из партнеров AWS.

Какие факторы следует учитывать перед миграцией данных?

Решение для переноса данных требует планирования каждой детали. Вот несколько факторов, которые следует учитывать.

Миграция данных с использованием или без использования сети

Перенос значительного объема данных может занять много времени и ресурсов даже при использовании современных сетевых решений. Для некоторых организаций может быть более эффективным и экономичным переносить данные из одного места в другое путем переноса физических устройств хранения. Эта стратегия также более безопасна, чем отправка данных через Интернет.

Формат данных

Как правило, перенос данных в том же формате из одного места в другое прост. Например, перенос баз данных с локального SQL Server на облачный SQL Server не требует изменений формата или схемы. Однако потребуется промежуточный этап обработки, если вы хотите преобразовать данные в новый формат до переноса центра обработки данных.

Сбои в работе

Во время миграции часто возникают простои или замедление работы системы. Вы можете запланировать миграцию в часы наименьшей загруженности, чтобы свести к минимуму влияние сбоев. Многие организации откладывают перенос данных, поскольку не могут позволить себе простои системы. Однако такой подход может увеличить количество перерывов в работе в будущем.

Каковы этапы миграции данных?

Каждая организация планирует миграцию данных в соответствии со своими требованиями. Мы даем общее представление о шагах, которые помогут сделать весь процесс миграции данных более эффективным.

Просмотрите исходные данные

Перед миграцией данных необходимо просмотреть и описать существующие данные. Сначала взгляните на формат носителя данных и его текущую среду. После этого, где возможно, следует просмотреть данные в специальной программе, чтобы определить их структуру и атрибуты. Вам нужно будет сопоставить структуру с новой системой данных.

Определите пункт назначения

После изучения исходных данных выберите подходящее решение для целевого хранения данных на основе структуры и атрибутов. Иногда необходимо изменить структуру, атрибуты или формат данных в соответствии с новым решением для хранения данных. В случае интеграции данных вам необходимо реорганизовать исходные данные в соответствии со спецификациями целевых данных.

Опишите стратегию миграции данных

Как только вы определите свои потребности и целевую среду для миграции данных, вам понадобится план ее выполнения. План миграции данных – это дорожная карта к успешной миграции.

Чтобы понять, как будет происходить миграция данных, необходимо определить:

  • необходимые вам системы и инструменты миграции данных;
  • требования безопасности;
  • любые процессы преобразования данных;
  • затраты и потребности в людских ресурсах;
  • примерный график миграции данных.

Составляя стратегию миграции данных, нужно также определить ее потенциальное влияние на пользователей. Сюда входит создание планов действий в чрезвычайных ситуациях или серии сообщений для оповещения пользователей о запланированных отключениях.

Реализуйте технические аспекты

Перед запуском процесса миграции данных необходимо настроить целевую среду, включая безопасность и разрешения. Если возможно, создайте схему миграции данных в виде кода, чтобы обеспечить автоматизированное решение для повторного использования. Можно использовать код для будущих аналогичных миграций или сохранить его в качестве документального подтверждения процесса. Кодифицированная схема служит «живым» планом миграции данных.

Протестируйте решение

Тестирование необходимо для снижения рисков, связанных с миграцией данных. Тип тестирования зависит от форматов данных и используемого решения. Например, можно выбрать небольшой фрагмент данных для тестирования, фиктивные данные или даже копию текущих системных данных. Для интеграции данных убедитесь, что новые тестовые данные совпадают с существующими.

Запустите миграцию данных

После успешного завершения тестов вы можете запланировать и начать миграцию данных. Чтобы устранить неполадки в случае непредвиденных ситуаций, обеспечьте доступность нужной команды в течение всего процесса – даже если он выполняется в нерабочее время.

После переноса данных изучите текущие данные в новой среде, чтобы проверить правильность и убедиться, что система работает должным образом. Если в течение заданного периода времени новая система работает нормально, вы можете безопасно вывести старую среду из эксплуатации.

Какие есть рекомендации по миграции данных?

Вот несколько советов, которые помогут сделать процесс миграции данных более эффективным и экономичным.

Четко изложите экономическое обоснование

Для успешной миграции данных необходимо, чтобы экономическое обоснование миграции было четким и оправданным. Например, представьте, что пользователи уже выполняют запросы к существующим базам данных. Организация приобрела новое решение для анализа данных, но пока обучение по нему прошли только три человека, а продлится оно более года. Если попытаться перенести базу данных до завершения обучения, это может негативно повлиять на бизнес-результаты организации.

Тщательно оцените пространство решения

Новый подход к обработке данных может потребовать учесть больше факторов, чем обычное сравнительное решение о покупке. Например, перед переносом приложений в облако организация, возможно, захочет рассмотреть возможность контейнеризации своих архитектур. Контейнеризация поможет максимально использовать преимущества облачной инфраструктуры. Целевые решения для этих двух стратегий также совершенно отличаются.

Подробнее о контейнеризации »

Очистите данные

Хотя это не всегда необходимо, рекомендуется очистить данные перед миграцией, а именно удалить неполные и неверные данные или дубликаты.

Полностью документируйте процесс

Документирование проекта миграции данных способствует созданию аудиторской отчетности в случаях приобретения, слияния или необходимости соблюдать нормативные требования. Это также полезно для обобщения уроков и знаний, полученных организацией.

Какие бывают проблемы с миграцией данных?

Учитывая важность данных в организации, их перенос является сложной задачей и требует тщательной оценки рисков. Далее мы рассмотрим распространенные проблемы.

Устойчивость бизнеса

Миграция данных должна осуществляться с минимальными перебоями в работе сервисов. Если невозможно избежать простоев или замедлений, планируйте миграцию в нерабочее время. Предупреждайте пользователей с помощью электронных писем, уведомлений в приложениях и прикрепленных публикаций в социальных сетях.

Расходы на миграцию

При передаче данных необходимы инструменты, человеческие ресурсы, новая инфраструктура данных и денежные средства на вывод из эксплуатации старой инфраструктуры. Перед началом процесса убедитесь, что вы выделили бюджет на все аспекты. Также важно учитывать любые затраты, связанные с потерей производительности или дохода во время простоя приложений. Чтобы свести к минимуму затраты, связанные с миграцией, постарайтесь ограничить перебои и заблаговременно проинформировать о миграции всех пользователей, которых она может затронуть.

Безопасность данных

Обеспечение безопасности данных как при передаче, так и в новой среде требует тщательного планирования. Перед передачей следует выполнить сложное шифрование, а для процесса передачи данных – создать виртуальные частные сети. Тщательно протестируйте и оцените правила безопасности и разрешения новой среды перед миграцией.

Новые системные сбои и неисправности

Сложно обеспечить успешную миграцию данных для всех сценариев. Иногда передача данных может привести к сбоям или неожиданным результатам. В случае неисправностей и сбоев вам нужен план действий в чрезвычайных ситуациях. Всегда имейте резервные копии, чтобы при необходимости можно было вернуться к старым системам данных.

Как AWS может удовлетворить ваши требования в миграции данных?

Amazon Web Services (AWS) предоставляет широкий спектр решений, которые помогут вам в переносе данных в облако. Мы поможем вам найти и защитить службы и ресурсы, соответствующие вашим требованиям, а также окажем помощь с запуском самого процесса.

Например, для миграции данных вы можете воспользоваться указанными ниже сервисами.

  • AWS DataSync позволяет безопасно обнаруживать данные и мигрировать их в AWS, обеспечивая сквозную защиту, упрощенное планирование и управление перемещением данных. 
  • AWS Direct Connect предоставляет возможность настроить выделенное сетевое соединение с AWS. Это позволяет защитить данные при их передаче между вашей сетью и AWS, используя различные варианты шифрования.
  • Amazon Data Firehose используется для потоковой передачи данных. С его помощью можно надежно загружать потоки данных в реальном времени в озера данных, хранилища и аналитические сервисы.
  • AWS Snowconeпредлагает развертывание периферийных вычислительных устройств. Они являются компактными, прочными и надежными. Устройства Snowcone можно использовать для периферийных вычислений, хранения данных и физической передачи данных в дороге. Этот вариант устройств подходит для использования в суровых условиях, когда возможности подключения ограничены или их вовсе нет.
  • Семейство для пересылки файлов AWS позволяет легко управлять передачей файлов. Можно также модернизировать рабочие процессы передачи данных в Amazon Simple Storage Service (Amazon S3) или Amazon Elastic File System (Amazon EFS). Это делается в течение нескольких часов с использованием существующих систем аутентификации.

Создайте аккаунт и начните работу с миграцией данных на AWS уже сегодня.