- Продукты›
- База данных›
- Amazon DocumentDB›
- Вопросы и ответы по Amazon DocumentDB (с поддержкой совместимости с MongoDB)
Вопросы и ответы по Amazon DocumentDB (с поддержкой совместимости с MongoDB)
Темы страниц
Общие вопросыОбщие вопросы
Что представляет собой Amazon DocumentDB (совместимость с MongoDB)?
Сервис Amazon DocumentDB (совместимость с MongoDB) – это быстрая, масштабируемая, высокодоступная и полностью управляемая корпоративная база данных документов, которая поддерживает специализированные рабочие нагрузки JSON. Amazon DocumentDB специально создавалась как база данных документов, поэтому в ней очень легко сохранять, индексировать данные в формате JSON и выполнять запросы к ним. Для запуска и масштабирования рабочих нагрузок в Amazon DocumentDB, а также для управления ими разработчики могут использовать тот же код приложения, драйверы и инструменты MongoDB, с которыми работают сейчас. Получите усовершенствованную производительность, масштабируемость и доступность, не беспокоясь об управлении базовой инфраструктурой.
С помощью Сервиса миграции баз данных AWS (AWS DMS) клиенты могут с минимальными простоями перенести свои нереляционные базы данных MongoDB, размещенные как локально, так и в Эластичном облаке вычислений Amazon (EC2), в сервис Amazon DocumentDB. Amazon DocumentDB не требует предварительных вложений, оплате подлежат только используемые ресурсы.
Какие сценарии использования хорошо подходят для такой базы данных документов, как Amazon DocumentDB?
Документно-ориентированные базы данных – это одна из самых быстро развивающихся категорий баз данных noSQL. Это связано в первую очередь с тем, что базы данных документов поддерживают и гибкие схемы, и широкие возможности для запросов. Модель документов – отличный выбор для случаев использования с динамическими наборами данных, которые требуют специальных запросов, индексирования и агрегирования. Благодаря масштабу, который обеспечивает Amazon DocumentDB, она применяется самыми разными клиентами для таких сценариев использования, как управление контентом, персонализация, каталоги, мобильные и веб-приложения, IoT и управление профилями.
Что означает «совместимость с MongoDB»?
«Совместимость с MongoDB» означает, что Amazon DocumentDB взаимодействует с открытыми API MongoDB версий 3.6, 4.0 и 5.0 на платформе Apache 2.0. Таким образом, вы можете использовать драйверы, приложения и инструменты MongoDB в Amazon DocumentDB практически без изменений. Amazon DocumentDB поддерживает большинство API MongoDB, обычно используемых клиентами, но не все. Мы стремимся предоставить клиентам возможности, которые им действительно необходимы.
С момента выпуска мы прислушиваемся к отзывам клиентов и уже добавили более 80 возможностей, в том числе совместимость с MongoDB 4.0 и 5.0, транзакции и сегменты. Подробнее о поддерживаемых API MongoDB см. в документации по совместимости. Подробнее о недавно выпущенных версиях Amazon DocumentDB см. в разделе «Объявления об Amazon DocumentDB» на странице ресурсов по Amazon DocumentDB.
Ограничено ли использование Amazon DocumentDB условиями лицензии MongoDB SSPL?
Нет. Amazon DocumentDB не использует код SSPL для MongoDB, поэтому соответствующая лицензия не распространяется на этот сервис. Вместо этого Amazon DocumentDB взаимодействует с открытыми API MongoDB 3.6, 4.0 и 5.0 на платформе Apache 2.0. Мы продолжим прислушиваться к отзывам клиентов и добавлять необходимые им возможности. Подробнее о поддерживаемых API MongoDB см. в документации по совместимости. Подробнее о недавно выпущенных версиях Amazon DocumentDB см. в разделе «Объявления об Amazon DocumentDB» на странице ресурсов по Amazon DocumentDB.
Как перенести данные из существующей базы данных MongoDB в Amazon DocumentDB?
С помощью Сервиса миграции баз данных AWS (DMS) клиенты могут с минимальными простоями перенести в сервис Amazon DocumentDB свои базы данных MongoDB, размещенные как локально, так и в Эластичном вычислительном облаке Amazon (EC2). DMS позволяет выполнить миграцию фрагментированного кластера или набора реплик MongoDB в Amazon DocumentDB. Кроме того, для переноса данных из базы данных MongoDB в Amazon DocumentDB клиенты могут использовать большинство существующих инструментов, в том числе mongodump/mongorestore, mongoexport/mongoimport, и инструменты сторонних разработчиков, поддерживающие режим Change Data Capture (CDC) через oplog. Подробнее см. в разделе о миграции в Amazon DocumentDB.
Потребуется ли для работы с Amazon DocumentDB менять драйверы клиентов?
Нет, сервис Amazon DocumentDB поддерживает подавляющее большинство драйверов MongoDB, совместимых с MongoDB 3.4 и более поздних версий.
Поддерживает ли Amazon DocumentDB транзакции ACID?
Да. Благодаря совместимости с MongoDB 4.0, Amazon DocumentDB теперь поддерживает возможность выполнять транзакции атомарности, непротиворечивости, изолированности, долговечности (ACID) для нескольких документов, выражений, коллекций и баз данных одновременно.
Распространяется ли на Amazon DocumentDB график прекращения поддержки (EOL) MongoDB?
Нет, Amazon DocumentDB не следует тем же жизненным циклам поддержки, что и MongoDB, и график EOL MongoDB не применяется к Amazon DocumentDB.
Как получить доступ к кластеру Amazon DocumentDB?
Развертывание кластеров Amazon DocumentDB выполняется в Amazon VPC (VPC), принадлежащем клиенту. Доступ к ним можно получить с инстансов Эластичного облака вычислений Amazon (EC2) или с помощью других сервисов AWS, развернутых в том же VPC. Кроме того, инстансы Amazon EC2 или другие сервисы AWS из других VPC в том же регионе или других регионах могут обращаться к Amazon DocumentDB посредством пирингового подключения между VPC. Доступ к кластерам Amazon DocumentDB нужно выполнять через оболочку mongo или драйверы MongoDB. При подключении к кластеру сервис Amazon DocumentDB запрашивает аутентификацию. Подробнее о дополнительных вариантах см. в разделе о подключении к кластеру Amazon DocumentDB извне Amazon VPC.
Почему для использования Amazon DocumentDB требуются разрешения и ресурсы Amazon RDS?
Для предоставления некоторых возможностей управления, включая управление жизненным циклом инстансов, шифрование данных при хранении с использованием ключей Сервиса управления ключами Amazon (KMS) и управление группами безопасности, Amazon DocumentDB использует ту же операционную технологию, что применяется в Службе реляционных баз данных Amazon (RDS) и Amazon Neptune. При использовании CLI API AWS для describe-db-instances и describe-db-clusters мы рекомендуем фильтровать ресурсы Amazon DocumentDB с указанием следующего параметра: «--filter Name=engine,Values=docdb».
Какие типы инстансов предлагаются в Amazon DocumentDB?
Актуальная информация о доступных типах инстансов по регионам находится на странице цен на Amazon DocumentDB.
Как можно попробовать работать с Amazon DocumentDB?
Чтобы попробовать работать с Amazon DocumentDB, изучите руководство по началу работы.
Существует ли соглашение об уровне обслуживания (SLA) для Amazon DocumentDB?
Да. Подробнее см. на странице соглашения об уровне использования для Amazon DocumentDB (совместимость с MongoDB).
Производительность
Какого уровня производительности можно ожидать от Amazon DocumentDB?
Во время записи в хранилище Amazon DocumentDB сохраняет только журналы с упреждающей записью и не требует записи полной синхронизации буферных страниц. В результате такой оптимизации, не влияющей на надежность, операции записи в Amazon DocumentDB обычно исполняются быстрее, чем в традиционных базах данных. Кластеры Amazon DocumentDB способны масштабироваться до миллионов операций чтения в секунду и до 15 реплик чтения.
Цены
Сколько стоит Amazon DocumentDB и в каких регионах AWS доступен этот сервис?
Актуальная информация по регионам и ценам находится на странице цен на Amazon DocumentDB.
Есть ли у Amazon DocumentDB уровень бесплатного пользования и можно ли начать работу бесплатно?
Да, вы можете пользоваться бесплатной пробной версией Amazon DocumentDB в течение 1 месяца. Если вы ранее не пользовались Amazon DocumentDB, то имеете право пользоваться бесплатной пробной версией в течение 1 месяца. Ваша организация получит 750 часов использования инстансов t3.medium в месяц, 30 млн операций ввода-вывода, 5 ГБ хранилища и 5 ГБ хранилища резервных копий бесплатно на 30 дней. По окончании действия бесплатной пробной версии (один месяц) или при превышении объема разрешенного использования можно остановить кластер, чтобы избежать затрат, или продолжить его использование с оплатой согласно стандартному тарифу по требованию. Дополнительную информацию см. на странице бесплатной пробной версии DocumentDB.
Почему следует использовать конфигурацию Amazon DocumentDB, оптимизированную для ввода-вывода?
Конфигурация Amazon DocumentDB, оптимизированная для ввода-вывода – идеальный выбор, если вы хотите контролировать свои затраты или у имеете приложения с высокой частотой операций ввода-вывода. Если вы ожидаете, что затраты на ввод-вывод превысят 25 % от общей стоимости базы данных Amazon DocumentDB, это будет наилучшим вариантом в плане соотношения цены и производительности. Дополнительные сведения, включая инструкции по началу работы, см. в нашей документации по конфигурации Amazon DocumentDB, оптимизированной для ввода-вывода.
Можно ли переключаться между оптимизированной для ввода-вывода и стандартной конфигурациями хранения данных?
Вы можете переключать существующие кластеры баз данных раз в 30 дней на оптимизированную для ввода-вывода конфигурацию Amazon DocumentDB. В любой момент можно вернуться к стандартным конфигурациям хранилища Amazon DocumentDB.
С конфигурацией Amazon DocumentDB, оптимизированной для ввода-вывода, нужно ли продолжать платить за операции ввода-вывода, необходимые для репликации данных между регионами с помощью глобальных кластеров?
Да, плата за операции ввода-вывода, необходимые для репликации данных в разных регионах, продолжает взиматься. За операции ввода-вывода для чтения и записи, что отличаются от репликации данных, в оптимизированной для ввода-вывода конфигурации Amazon DocumentDB плата не взимается. Дополнительные сведения см. в нашей документации по Amazon DocumentDB, оптимизированной для ввода-вывода.
Эластичные кластеры
Что такое эластичные кластеры Amazon DocumentDB?
Эластичные кластеры Amazon DocumentDB обеспечивают эластичное масштабирование базы данных документов для обработки миллионов операций записи и чтения до объема, исчисляемого в петабайтах. Эластичные кластеры упрощают взаимодействие клиентов с Amazon DocumentDB, автоматически управляя базовой инфраструктурой и устраняя потребность в создании, удалении, обновлении и масштабировании инстансов.
Вопрос. Как начать работу с эластичными кластерами?
Вы можете создать эластичный кластер с помощью API, SDK, интерфейса командной строки Amazon DocumentDB, CloudFormation (CFN) или консоли AWS. При выделении кластера вы указываете, сколько сегментов и вычислительных мощностей на сегмент нужно для рабочей нагрузки. После создания кластера вы готовы приступить к использованию масштабируемости эластичных кластеров. Теперь вы можете подключаться к эластичному кластеру и читать или записывать данные прямо в своем приложении. Эластичные кластеры являются эластичными. В зависимости от потребностей рабочей нагрузки вы можете добавлять или удалять вычислительные мощности, изменяя количество сегментов и количество вычислительных мощностей в кластере с помощью консоли, API, командной строки или SDK AWS. Эластичные кластеры будут автоматически выделять и отменять выделение базовой инфраструктуры и перераспределять данные.
Как работают эластичные кластеры
Эластичные кластеры используют сегментирование для распределения данных в распределенной системе хранилища Amazon DocumentDB. В ходе сегментирования, которое также называется разбиением, крупные наборы данных разделяются на небольшие наборы данных на множестве узлов, что позволяет пользователям масштабировать базу данных, преодолевая ограничения вертикального масштабирования цельной базы данных. Эластичные кластеры отделяют вычислительные мощности от хранилища в Amazon DocumentDB. Вместо того чтобы перераспределять коллекции, перемещая небольшие фрагменты данных между вычислительными узлами, эластичные кластеры могут эффективно копировать данные в распределенной системе хранения.
Какие типы разбиения на сегменты используются эластичными кластерами?
Эластичные кластеры поддерживают разбиение на основе хэша.
Чем эластичные кластеры отличаются от разбиения на сегменты в MongoDB?
Используя эластичные кластеры, вы можете с легкостью проводить масштабирование в рабочей нагрузке в Amazon DocumentDB обычно без простоя или с минимальным простоем приложений и снижения производительности, независимо от размера данных. Подобная операция в MongoDB снижает производительность приложения и длится часами, а иногда даже днями. Кроме того, эластичные кластеры предоставляют возможности дифференцированного управления, например резервное копирование без снижения производительности и быстрое восстановление на момент времени, позволяя клиентам уделять основное внимание работе с приложением, а не управлению базой данных.
Нужно ли мне вносить изменения в свое приложение, чтобы использовать эластичные кластеры?
Нет. Вам не нужно вносить изменения в свое приложение, чтобы использовать эластичные кластеры.
Могу ли я преобразовать существующий Amazon DocumentDB в эластичный кластер?
Нет, в ближайшем будущем вы можете использовать Сервис миграции баз данных AWS (DMS) для переноса данных из существующего кластера Amazon DocumentDB в эластичный кластер.
Как определить ключ сегмента?
Выбор оптимального ключа сегмента для эластичных кластеров не отличается от других баз данных. Хороший ключ сегмента отличается двумя характеристиками: высокой частотой и высокой мощностью. Например, если ваше приложение хранит user_orders в DocumentDB, то обычно данные должен получать пользователь. Поэтому вы хотите, чтобы все заказы, связанные с определенным пользователем, хранились в одном сегменте. В таком случае хорошим ключом сегмента будет user_id. Подробнее...
Какие концепции связаны с эластичными кластерами?
- Эластичный кластер – кластер Amazon DocumentDB, позволяющий масштабировать пропускную способность рабочей нагрузки до миллионов операций чтения-записи в секунду, а размер хранилища – до петабайтов. Эластичный кластер состоит из одного или нескольких сегментов для томов вычислений и хранения данных и по умолчанию отличается высокой доступностью в нескольких зонах доступности.
- Сегмент выполняет вычисления для эластичного кластера. По умолчанию сегмент содержит три узла: один – для записи, другие два – для чтения. У вас может быть максимум 32 сегмента, в каждом из которых может быть максимум 64 виртуальных ЦПУ.
- Ключ сегмента – необязательное поле в документах JSON, используемое эластичными кластерами для направления трафика чтения и записи на соответствующий компьютер. Советуем выбирать ключи, которые содержат множество уникальных значений. Хороший ключ сегмента будет равномерно распределять данные между множеством базовых сегментов, обеспечивая наивысшую пропускную способность и производительность рабочей нагрузки.
- Сегментированная коллекция – коллекция, данные в которой распределены по эластичному кластеру.
Как эластичные кластеры относятся к другим сервисам AWS?
Эластичные кластеры интегрируются с другими сервисами AWS таким же способом, как это сейчас делает DocumentDB. Во-первых, вы можете воспользоваться Сервисом миграции баз данных AWS (DMS) для миграции с MongoDB и других реляционных баз данных на эластичные кластеры. Во-вторых, вы можете отслеживать производительность эластичного кластера с помощью Amazon CloudWatch. В-третьих, вы можете настроить аутентификацию и авторизацию через пользователей и роли AWS IAM и использовать AWS VPC для безопасных подключений только к облакам VPC. Наконец, вы можете использовать AWS Glue для импорта данных из других сервисов AWS и их экспорта в другие сервисы AWS, в частности S3, Redshift и OpenSearch.
Можно ли выполнить миграцию сегментированных рабочих нагрузок MongoDB в эластичные кластеры?
Да. Вы можете выполнить миграцию сегментированных рабочих нагрузок MongoDB в эластичные кластеры. Вы можете либо воспользоваться Сервисом миграции баз данных AWS или встроенными инструментами MongoDB, такими как mongodump и mongorestore, для миграции своей рабочей нагрузки MongoDB в эластичные кластеры. Также эластичные кластеры поддерживают широко используемые API MongoDB, такие как shardCollection(), обеспечивая гибкость повторного использования существующих инструментов и сценариев в Amazon DocumentDB.
Оборудование, масштабирование и хранилище
Каковы минимальные и максимальные лимиты для хранилища кластера Amazon DocumentDB?
Минимальный объем хранилища – 10 ГБ. По мере использования кластера хранилище Amazon DocumentDB может, не снижая производительности, автоматически расширяться до 128 ТиБ с шагом в 10 ГБ. При использовании эластичных кластеров Amazon DocumentDB хранилище будет автоматически расти до 4 ПБ с шагом в 10 ГБ. В любом случае выделять хранилище заранее не требуется.
Как выполняется масштабирование Amazon DocumentDB?
Масштабирование Amazon DocumentDB выполняется по двум направлениям: для хранилища и для вычислительных ресурсов. Хранилище Amazon DocumentDB автоматически масштабируется с 10 ГБ до 128 ТиБ в кластерах на базе инстансов и до 4 PiB для эластичных кластеров Amazon DocumentDB. Вычислительные ресурсы Amazon DocumentDB можно масштабировать путем использования более крупных инстансов или же горизонтально (для повышения производительности при чтении), т. е. путем добавления в кластер дополнительных инстансов‑реплик.
Как масштабировать вычислительные ресурсы, связанные с кластером Amazon DocumentDB?
Вычислительные ресурсы, выделенные инстансу, можно масштабировать в Консоли управления AWS, выбрав нужный инстанс и нажав кнопку «Modify» (Изменить). Масштабирование ресурсов памяти и ЦПУ выполняется за счет изменения класса инстанса.
После изменения класса инстанса запрошенные изменения вступают в силу в течение настроенного окна обслуживания. Как вариант, можно установить флажок «Apply Immediately» (Применить сразу) для немедленного выполнения запроса на масштабирование. В обоих случаях это снизит доступность БД на несколько минут, в течение которых выполняется масштабирование. Имейте в виду, что одновременно будут применены любые другие ожидающие применения системные изменения.
Резервное копирование и восстановление
Как включить резервное копирование для кластера?
Автоматическое резервное копирование для кластеров в Amazon DocumentDB включено всегда. Простая возможность резервного копирования базы данных в Amazon DocumentDB обеспечивает восстановление кластера на момент времени. Интервал резервного копирования для восстановления на момент времени можно увеличить до 35 дней. Резервное копирование не влияет на производительность базы данных.
Можно ли делать снимки состояния кластера и хранить их в течение неограниченного времени?
Да. Созданные вручную снимки состояния можно хранить дольше, чем предусмотрено интервалом резервного копирования. Создание снимков состояния не влияет на производительность. Учтите, что восстановление данных из снимков состояния кластера требует создания нового кластера.
Какова процедура восстановления при отказе инстанса?
Amazon DocumentDB автоматически обеспечивает долговечность данных в трех зонах доступности в пределах региона и автоматически пытается восстановить ваш инстанс в работоспособной зоне доступности без потери данных. В маловероятном случае, когда данные в хранилище Amazon DocumentDB становятся недоступны, можно восстановить их в новый кластер из снимка состояния кластера или выполнить операцию восстановления на момент времени. Имейте в виду, что последнее доступное время восстановления при операции восстановления на момент времени может отставать от текущего на несколько минут (не более пяти).
Что происходит с автоматическими резервными копиями и снимками состояния кластера при удалении кластера?
Система предлагает создать снимок финального состояния при удалении инстанса. Такой снимок состояния впоследствии можно будет применить для восстановления удаленного инстанса. После удаления инстанса сервис Amazon DocumentDB сохраняет итоговые снимки состояния, созданные пользователями, со всеми прочими снимками состояния, созданными вручную. При этом после удаления сохраняются только снимки состояния (то есть созданные автоматически резервные копии для восстановления на момент времени не сохраняются).
Что происходит с резервными копиями и снимками состояния кластера при удалении аккаунта?
При удалении аккаунта AWS все созданные автоматически резервные копии и резервные копии снимков состояния, содержащиеся в аккаунте, будут удалены.
Можно ли использовать свои снимки состояния совместно с другим аккаунтом AWS?
Да. Amazon DocumentDB предоставляет возможность создавать снимки состояния кластера, которые в дальнейшем можно использовать для его восстановления. Снимок можно предоставить в совместное использование для другого аккаунта AWS, при этом владелец такого аккаунта сможет использовать этот снимок для восстановления кластера, содержащего ваши данные. Снимок состояния можно сделать даже публичным – в этом случае любой пользователь сможет восстановить кластер, содержащий соответствующие публичные данные. Эту возможность можно применять для совместного использования данных разными средами (рабочей средой, средой разработки и тестирования, промежуточной средой и т. д.), когда они относятся к разным аккаунтам AWS, а также для того, чтобы безопасно хранить резервные копии всех данных в нескольких аккаунтах на тот случай, если используемый главный аккаунт AWS будет взломан.
Взимается ли плата за совместно используемые снимки состояния?
За совместное использование снимка состояния несколькими аккаунтами плата не взимается. При этом плата может начисляться за сам снимок состояния, а также за любой кластер, восстановленный из совместно используемых снимков состояния.
Возможно ли автоматическое совместное использование снимков состояния?
Совместное использование автоматически созданных снимков состояния кластера не поддерживается. Для совместного использования автоматически созданных снимков состояния нужно вручную создать копию снимка состояния и сделать его общим.
Можно ли настроить совместный доступ к снимкам состояния Amazon DocumentDB за пределами одного региона?
Нет. Совместно используемые снимки состояния Amazon DocumentDB будут доступны только для аккаунтов, которые находятся в том же регионе, что и аккаунт, предоставивший общий доступ к этим снимкам состояния.
Можно ли настроить совместный доступ к зашифрованным снимкам состояния Amazon DocumentDB?
Да. К зашифрованным снимкам состояния Amazon DocumentDB можно настроить совместный доступ. Получателю совместно используемого снимка состояния потребуется доступ к ключу KMS, использованному для шифрования этого снимка.
Можно ли использовать снимки состояния Amazon DocumentDB за пределами сервиса?
Нет, снимки состояния Amazon DocumentDB можно использовать только в пределах этого сервиса.
Что произойдет с резервными копиями при удалении кластера?
Вы можете создать итоговый снимок состояния при удалении кластера. Такой снимок состояния впоследствии можно будет применить для восстановления удаленного кластера. После удаления кластера сервис Amazon DocumentDB сохраняет итоговые снимки состояния, созданные пользователями, со всеми прочими снимками состояния, созданными вручную.
Высокая доступность и репликация
Каким образом Amazon DocumentDB повышает устойчивость кластера к сбоям диска?
Amazon DocumentDB автоматически делит общий объем хранилища на сегменты по 10 ГБ, распределенные по нескольким дискам. Каждый 10‑гигабайтный блок хранилища шестикратно реплицируется в трех зонах доступности (AZ). Amazon DocumentDB обеспечивает автоматическую обработку потери до двух копий данных без снижения доступности операций записи и до трех копий без снижения доступности операций чтения. Кроме того, тома хранилища Amazon DocumentDB обладают способностью к самостоятельному восстановлению. Блоки данных и диски непрерывно сканируются на наличие ошибок и автоматически восстанавливаются.
Как Amazon DocumentDB сокращает время восстановления после сбоя базы данных?
Чтобы база данных Amazon DocumentDB стала доступна для операций после сбоя базы данных, в отличие от других БД, не требуется воспроизводить журнал повтора с последней контрольной точки базы данных (обычно этот процесс занимает пять минут) и проверять, все ли изменения были применены. Благодаря этому время перезапуска базы данных в большинстве случаев составляет менее 60 секунд. Amazon DocumentDB изолирует кэш от процессов базы данных и делает его мгновенно доступным уже во время перезагрузки. Это предотвращает необходимость регулировать доступ до тех пор, пока кэш не заполнен, во избежание сбоев доступа.
Какие типы реплик поддерживает Amazon DocumentDB?
Amazon DocumentDB поддерживает реплики чтения, подключенные к тому же тому хранилища, что и основной инстанс. Сделанные в основном инстансе обновления видны всем репликам Amazon DocumentDB.
- Возможность: реплики чтения Amazon DocumentDB
- Количество реплик: до 15
- Тип репликации: асинхронный (обычно на уровне миллисекунд)
- Влияние на производительность основного инстанса: низкое
- Возможность использования в качестве целевого объекта при обработке отказа: есть (без потери данных)
- Возможность автоматической обработки отказа: есть
Можно ли при работе с Amazon DocumentDB использовать реплики в различных регионах?
Да, реплицировать данные между регионами можно с помощью функции Global Cluster. Кластеры Global Clusters охватывают множество регионов AWS. Global Clusters реплицируют данные в кластеры пяти регионов, почти не влияя на производительность. Глобальные кластеры Global Clusters обеспечивают аварийное восстановление в результате сбоев в масштабе региона и чтение глобальных данных с низкой задержкой. Подробнее об этом можно прочитать в нашем блоге.
Можно ли указывать определенные реплики в качестве приоритетных целевых объектов при обработке отказа?
Да. Каждому инстансу в кластере можно присвоить приоритет использования. При отказе основного инстанса сервис Amazon DocumentDB назначает вместо него реплику с наивысшим приоритетом. Если две или более реплик имеют одинаковый уровень приоритета, сервис Amazon DocumentDB использует реплику, размер которой совпадает с размером основного инстанса.
Можно ли изменять уровни приоритета инстансов после их создания?
Уровень приоритета инстанса можно изменять в любое время. Само по себе изменение уровня приоритета не приводит к запуску механизма отказоустойчивости.
Можно ли запретить перемещение определенных реплик в основной инстанс?
Репликам, которые не планируется преобразовывать в основной инстанс, можно назначить более низкий уровень приоритета. Но если по какой‑либо причине реплики с высоким приоритетом в кластере неработоспособны или недоступны, Amazon DocumentDB будет использовать реплику с более низким приоритетом.
Каким образом Amazon DocumentDB обеспечивает высокую доступность кластера?
Amazon DocumentDB можно развертывать в высокодоступной конфигурации, используя инстансы‑реплики в нескольких зонах доступности AWS в качестве целевых объектов при обработке отказа. Если на основном инстансе происходит сбой, инстанс реплики автоматически становится новым основным инстансом. Данный процесс происходит с минимальными сбоями в работе сервиса.
Как можно повысить доступность отдельного инстанса Amazon DocumentDB?
Можно добавить дополнительные реплики Amazon DocumentDB. Реплики Amazon DocumentDB используют то же самое хранилище, что и основной инстанс. Любую реплику Amazon DocumentDB можно сделать основной без какой‑либо потери данных и, соответственно, использовать для повышения отказоустойчивости в случае сбоя основного инстанса. Для повышения доступности кластера просто создайте от 1 до 15 реплик в нескольких зонах доступности, и Amazon DocumentDB будет автоматически включать их в список выбора основного инстанса в случае его отказа.
Что происходит во время обработки отказа и сколько времени это занимает?
Amazon DocumentDB обрабатывает отказы автоматически, чтобы приложения могли как можно скорее возобновлять операции с базами данных без ручного вмешательства администратора.
- При наличии инстанса реплики Amazon DocumentDB в той же или в другой зоне доступности при обработке отказа сервис Amazon DocumentDB переадресует запись канонического имени (CNAME) инстанса так, чтобы она указывала на работоспособную реплику, которая, в свою очередь, становится основной. Обработка отказа обычно полностью выполняется за 30 секунд.
- При отсутствии инстанса реплики Amazon DocumentDB (т. е. при использовании кластера из одного инстанса) Amazon DocumentDB попытается создать новый инстанс в той же самой зоне доступности, что и исходный инстанс. Замена исходного инстанса выполняется на основе принципа «разумных усилий» и может не состояться, к примеру, если существует проблема, которая значительно влияет на зону доступности.
В случае потери соединения приложение должно попытаться повторно подключиться к базе данных.
Что происходит при обработке отказа в случае, когда имеется основной инстанс и инстанс реплики Amazon DocumentDB, активно обслуживающий трафик чтения?
Amazon DocumentDB автоматически обнаружит проблему с основным инстансом и перенаправит трафик операций чтения / записи на инстанс реплики Amazon DocumentDB. В среднем обработка отказа в такой ситуации занимает 30 секунд. Кроме того, на короткий промежуток времени будет прерван трафик операций чтения, который обслуживали инстансы реплик Amazon DocumentDB.
Насколько реплики отстают от первичного инстанса?
Поскольку реплики Amazon DocumentDB используют тот же самый том данных, что и первичный инстанс, никакого отставания репликации практически не существует. По нашим наблюдениям, интервал отставания обычно сохраняется на уровне десятков миллисекунд.
Безопасность и соответствие требованиям
Можно ли работать с Amazon DocumentDB в Виртуальном частном облаке Amazon (Amazon VPC)?
Да. Для этого все кластеры Amazon DocumentDB должны быть созданы в облаке VPC. Amazon VPC дает возможность определять топологию виртуальной сети, очень напоминающую традиционную сеть, которая могла бы работать в вашем собственном центре обработки данных. Это предоставляет нашим клиентам полный контроль над тем, кто получает доступ к их кластерам Amazon DocumentDB.
Поддерживается ли в Amazon DocumentDB управление доступом на основе ролей (RBAC)?
В Amazon DocumentDB реализована поддержка RBAC со встроенными ролями. RBAC позволяет принудительно применять рекомендованный доступ по принципу наименьших привилегий, ограничивая набор действий, которые разрешено выполнять пользователям. Подробнее об этом см. здесь.
Как существующие режимы аутентификации MongoDB работают с Amazon DocumentDB?
Amazon DocumentDB использует строгие границы сети и авторизацию VPC. Аутентификация и авторизация в API управления Amazon DocumentDB осуществляется на основе пользователей, ролей и политик IAM. Аутентификация в базе данных Amazon DocumentDB осуществляется с помощью стандартных инструментов и драйверов MongoDB с использованием стандартного механизма аутентификации MongoDB: Salted Challenge Response Authentication Mechanism (SCRAM).
Поддерживает ли Amazon DocumentDB шифрование данных при хранении?
Да. Amazon DocumentDB поддерживает шифрование кластеров с использованием ключей, управление которыми осуществляется в Сервисе управления ключами AWS (AWS KMS). В кластере Amazon DocumentDB с шифрованием шифруются все данные, хранимые в базовой системе хранения, а также их автоматические резервные копии, снимки состояния и реплики чтения в том же кластере. Шифрование и дешифрование осуществляются незаметно для пользователя. Дополнительную информацию об использовании KMS с Amazon DocumentDB см. в разделе о шифровании данных Amazon DocumentDB при хранении.
Можно ли зашифровать существующий незашифрованный кластер?
На данный момент шифрование существующего незашифрованного кластера Amazon DocumentDB не поддерживается. Чтобы использовать шифрование Amazon DocumentDB для существующего незашифрованного кластера, создайте новый кластер с включенным шифрованием и перенесите данные в него.
Какие виды сертификации соответствия поддерживаются сервисом Amazon DocumentDB?
Сервис Amazon DocumentDB разработан в соответствии в самыми строгими стандартами безопасности, что позволяет клиентам проверить наш уровень безопасности и выполнить свои обязательства по соответствию нормативным требованиям. Проверка Amazon DocumentDB показала его соответствие стандартам PCI DSS, ISO 9001, 27001, 27017 и 27018, SOC 1, 2 и 3, а также сертификации Health Information Trust Alliance (HITRUST) Common Security Framework (CSF). Кроме того, этот сервис соответствует требованиям HIPAA. Отчеты по соответствию AWS требованиям можно скачать в AWS Artifact.
Обновление основной версии
Что такое местное обновление основной версии?
С помощью местного обновления можно актуализировать кластеры Amazon DocumentDB 3.6 или 4.0 до Amazon DocumentDB 5.0 посредством консоли AWS, пакета средств разработки ПО (SDK) или интерфейса командной строки (CLI). Благодаря этому нет необходимости создавать новые кластеры или менять конечные точки. Местное обновление основной версии доступно во всех регионах, где есть Amazon DocumentDB 5.0. Для того чтобы начать работу с местным обновлением основной версии, ознакомьтесь с его документацией.
Почему мне следует использовать местное обновление основной версии?
Оно позволяет легко актуализировать кластеры Amazon DocumentDB 3.6 или 4.0 до версии 5.0 без необходимости выполнять резервное копирование, восстановление в другой кластер и без использования иных инструментов миграции данных. Таким образом, это сокращает время и количество усилий, которые нужны для обычного процесса обновления с настройкой исходных и целевых конечных точек, миграцией индексов и данных, изменением кода приложения и многим другим.
После обновления вам не нужно будет менять конечную точку в своих приложениях. Поскольку данные остаются в том же кластере, дополнительная плата за функцию не взимается.
Сколько составляет время простоя при местном обновлении основной версии?
Время простоя может варьироваться в зависимости от количества коллекций, индексов, баз данных и инстансов. Прежде чем запускать местное обновление основной версии производственного кластера, мы настоятельно рекомендуем сперва сделать это в среде тестирования, чтобы проверить время простоя, производительность, а также убедиться в том, что приложения работают должным образом.
Можно также использовать функцию быстрого клонирования Amazon DocumentDB, чтобы скопировать данные из кластера для тестирования. Вы можете обратиться за дополнительной помощью к нашему архитектору решений для баз данных, если у вас возникнут сложности с внедрением Amazon DocumentDB.
Какие версии движка сегодня поддерживают местное обновление основной версии?
Местное обновление доступно только в Amazon DocumentDB 3.6 или 4.0 в качестве отправной точки и версии 5.0 в качестве конечной точки. Но оно недоступно для глобальных или эластичных кластеров Amazon DocumentDB, а также DocumentDB 4.0 в качестве конечной точки.
Машинное обучение
Как использовать данные в Amazon DocumentDB для создания моделей машинного обучения?
Amazon DocumentDB поддерживает интеграцию с Amazon SageMaker Canvas, что упрощает создание моделей машинного обучения и настройку базовых моделей с использованием данных из Amazon DocumentDB без единой строки кода. Больше не нужно разрабатывать собственные конвейеры данных и машинного обучения между Amazon DocumentDB и SageMaker Canvas. Вы можете запустить SageMaker Canvas из консоли Amazon DocumentDB и добавить существующие базы данных Amazon DocumentDB в качестве источника данных, чтобы приступить к созданию моделей машинного обучения. Данные из DocumentDB в SageMaker Canvas можно использовать для создания моделей прогнозирования оттока клиентов, сбоев в обслуживании, финансовых показателей и продаж, выявления мошенничества, оптимизации запасов, обобщения и создания контента.
Какова стоимость использования Amazon DocumentDB в качестве источника данных в Amazon SageMaker Canvas для создания моделей машинного обучения?
Amazon SageMaker Canvas предлагает интерфейс без программирования для создания моделей машинного обучения с использованием данных из различных источников, включая Amazon DocumentDB. С вас взимается плата за использование SageMaker Canvas и за операции ввода-вывода при чтении данных из инстанса Amazon DocumentDB, осуществляемого SageMaker Canvas. За использование DocumentDB в качестве источника данных для Amazon SageMaker Canvas дополнительная плата не взимается. Подробнее см. на страницах цен на Amazon DocumentDB и SageMaker Canvas.
Генеративный искусственный интеллект и машинное обучение
Что такое векторный поиск?
Векторный поиск – это метод, используемый в машинном обучении (МО) для поиска точек данных, аналогичных заданной точке, путем сравнения их векторных представлений с использованием метрик расстояния или сходства. Чем ближе два вектора к векторному пространству, тем более похожими считаются базовые элементы. Этот метод помогает уловить смысл или семантику данных. Данный подход полезен в различных приложениях, где есть системы рекомендаций, обработка естественного языка и распознавание изображений.
Зачем использовать векторный поиск для Amazon DocumentDB?
Векторный поиск для Amazon DocumentDB сочетает гибкость и широкие возможности запросов, присущие базе данных документов на основе JSON, которая оснащена векторным поиском. Можно использовать существующие данные Amazon DocumentDB или гибкую структуру данных документов для создания сценариев использования машинного обучения и генеративного искусственного интеллекта, таких как семантический поиск, рекомендации по продуктам, персонализация, чат-боты, обнаружение мошенничества и аномалий. Дополнительные сведения см. в документации по векторному поиску для Amazon DocumentDB.
Какие версии Amazon DocumentDB поддерживают векторный поиск?
Векторный поиск доступен в кластерах на базе инстансов Amazon DocumentDB 5.0.
Чем реализация семантического поиска отличается от поиска по ключевым словам в Amazon DocumentDB?
Векторный поиск для Amazon DocumentDB позволяет использовать семантический поиск, чтобы уловить смысл, контекст и цель ваших данных. Поиск по ключевым словам позволяет найти документ на основе фактического текста или предопределенных сопоставлений синонимов. Например, в традиционном приложении интернет-магазина по запросу «красное платье» могут быть найдены товары, в описании которых есть слова «красное» и «платье». Семантический поиск позволит получить результаты с платьями разных оттенков красного, что повышает удобство использования.
Какова стоимость использования векторного поиска в Amazon DocumentDB?
Использование векторного поиска для Amazon DocumentDB не требует дополнительных затрат. При хранении, индексировании и поиске векторов в Amazon DocumentDB будет взиматься стандартная плата за вычисления, ввод-вывод, хранение и резервное копирование. Подробные сведения см. на странице цен на Amazon DocumentDB.
Зачем использовать машинное обучение без кода с Amazon DocumentDB и Amazon Sagemaker Canvas?
Amazon DocumentDB интегрируется с Amazon SageMaker Canvas, что упрощает создание приложений на основе генеративного искусственного интеллекта (ИИ) и машинного обучения (МО) с использованием данных, хранящихся в Amazon DocumentDB. Больше не нужно разрабатывать собственные конвейеры данных и машинного обучения между Amazon DocumentDB и SageMaker Canvas. Интеграция в консоль устраняет необходимость в подключении и доступе к данным, что позволяет ускорить разработку машинного обучения без необходимости писать код. Вы можете запустить SageMaker Canvas из консоли Amazon DocumentDB и добавить существующие базы данных Amazon DocumentDB в качестве источника данных.
Интеграция с нулевым использованием ETL
Почему следует использовать интеграцию Amazon DocumentDB с сервисом Amazon OpenSearch с нулевым использованием ETL?
Интеграция с сервисом Amazon OpenSearch с нулевым использованием ETL позволяет устранить операционные сложности, связанные с извлечением, преобразованием и загрузкой данных из коллекции Amazon DocumentDB в управляемый кластер или бессерверную коллекцию Amazon OpenSearch. Благодаря этой интеграции вам больше не придется создавать конвейеры данных, управлять ими или преобразовывать их содержание.
Используя генеративный искусственный интеллект, я хочу применять векторный поиск. В каких случаях лучше использовать не интеграцию с нулевым использованием ETL совместно с сервисом Amazon Opensearch, а встроенные возможности векторного поиска Amazon DocumentDB?
Если вы хотите использовать API MongoDB, следует применять возможности встроенных баз данных Amazon DocumentDB для выполнения векторного поиска среди документов. Интеграция Amazon DocumentDB с сервисом Amazon OpenSearch с нулевым использованием ETL – отличный вариант для поиска по коллекциям, а также для хранения и индексирования векторов с более чем 2000 измерениями.
Как данная интеграция с нулевым использованием ETL позволяет реплицировать данные из Amazon DocumentDB в сервис Amazon OpenSearch?
При интеграции Amazon DocumentDB с сервисом Amazon OpenSearch с нулевым использованием ETL применяется Amazon OpenSearch Ingestion, что позволяет беспрепятственно перемещать операционные данные из Amazon DocumentDB в сервис Amazon OpenSearch. Сначала следует включить функцию изменения потока в коллекции Amazon DocumentDB, которую вы планируете реплицировать. Функция интеграции с нулевым использованием ETL настраивает конвейер Amazon OpenSearch Ingestion в вашем аккаунте, который автоматически реплицирует данные в управляемый кластер сервиса Amazon OpenSearch или бессерверную коллекцию.
Amazon OpenSearch Ingestion автоматически определяет формат данных в коллекциях Amazon DocumentDB и сопоставляет данные с сервисом Amazon OpenSearch для наиболее эффективных результатов поиска. Можно синхронизировать данные из нескольких коллекций Amazon DocumentDB с помощью разных конвейеров в один управляемый кластер или бессерверную коллекцию Amazon OpenSearch, чтобы получить целостную аналитику по нескольким приложениям. Дополнительно можно указать собственные процессоры данных при определении конфигурации получения данных в сервисе Amazon OpenSearch. Последующие обновления коллекций DocumentDB также реплицируются в сервис Amazon OpenSearch без вмешательства в ручном режиме.
Как происходит преобразование данных при их перемещении из Amazon DocumentDB в сервис Amazon OpenSearch?
Интеграция с нулевым использование ETL работает на встроенных возможностях преобразования данных конвейеров Amazon OpenSearch Ingestion для агрегации и фильтрации данных во время их перемещения.
Какие есть варианты в случае, если я не хочу использовать алгоритм преобразования, предоставляемый Amazon OpenSearch Ingestion?
Можно написать пользовательский алгоритм преобразования, если вам требуется специализированная функция, а Amazon OpenSearch Ingestion будет управлять самим процессом преобразования. Кроме того, если необходимо без дополнительной настройки перенести все данные из источника в получатель, Amazon OpenSearch Ingestion предоставляет готовые чертежи, с помощью которых можно выполнять интеграцию всего несколькими щелчками мыши.
Какие разрешения системы безопасности необходимы для применения интеграции с нулевым использованием ETL для Amazon OpenSearch?
Чтобы Amazon OpenSearch Ingestion предоставлялись необходимые разрешения на репликацию данных с Amazon DocumentDB, функция интеграции с нулевым использованием ETL создает роль IAM с необходимыми разрешениями для чтения данных коллекции Amazon DocumentDB, а также записи в домен или коллекцию Amazon OpenSearch. Затем эту роль берут на себя конвейеры получения данных Amazon OpenSearch, гарантирующие постоянное соблюдение надлежащего уровня безопасности при перемещении данных от источника к конечной точке.
Как отслеживать состояние интеграции между Amazon DocumentDB и сервисом Amazon OpenSearch?
Все метрики по интеграции с Amazon DocumentDB с нулевым использованием ETL, можно просмотреть на консольных панелях, предоставленных в конвейерах Amazon DocumentDB и OpenSearch Ingestion. В Amazon CloudWatch также можно запрашивать журналы в реальном времени и настраивать собственные оповещения, которые запускаются при превышении заданных пользователем пороговых значений.
Посетите страницу цен на сервис Amazon DocumentDB (с поддержкой совместимости с MongoDB).
Получите мгновенный доступ к уровню бесплатного пользования AWS.
Начните разработку с помощью сервиса Amazon DocumentDB (с поддержкой совместимости с MongoDB) в консоли AWS.