Amazon DocumentDB (совместимость с MongoDB) – это сервис базы данных, специально созданный для масштабного управления данными JSON. Он полностью управляем и интегрирован в AWS, а также готов к высоконадежным корпоративным задачам. Этот масштабируемый сервис обеспечивает надежное управление критически важными рабочими нагрузками MongoDB.
В кластерах на базе инстансов Amazon DocumentDB хранилище автоматически масштабируется до 128 ТиБ, а в эластичных кластерах Amazon DocumentDB – до 4 ПБ, почти или совсем не влияя на работу вашего приложения. Amazon DocumentDB поддерживает миллионы запросов в секунду, добавляя вплоть до 15 реплик чтения с низкой задержкой за несколько минут, и при этом не вызывает простои приложения независимо от объема данных.
Amazon DocumentDB предлагает соглашение об уровне обслуживания на уровне 99,9 % и обеспечивает надежность данных в трех зонах доступности в регионе за счет репликации новых записей шестью способами, чтобы обеспечить читаемость данных в тех редких случаях, когда полностью отказывает зона доступности, а также одновременно отказывает узел хранения в другой зоне доступности. Благодаря шести способам репликации новых записей сервис Amazon DocumentDB устойчив к сбоям и обеспечивает отказоустойчивость к потерям данных в регионе. Клиенты платят только за одну копию хранилища.
С помощью Сервиса миграции баз данных AWS (DMS) можно с минимальными простоями перенести в Amazon DocumentDB свои самоуправляемые базы данных MongoDB.
Производительность при любом масштабе
Эластичные кластеры Amazon DocumentDB
Эластичные кластеры Amazon DocumentDB позволяют обрабатывать миллионы операций по записи и чтению в секунду, что дает клиентам возможность масштабировать свои базы данных документов за считаные минуты почти без простоев и снижения производительности. Также клиенты могут хранить петабайты данных и платить только за потребленные ресурсы без необходимости в управлении базовой инфраструктурой. Благодаря эластичным кластерам Amazon DocumentDB клиентам обеспечивается масштабирование практически любого приложения.
Высокая пропускная способность и низкая задержка запросов к документам
Amazon DocumentDB предлагает гибкую модель документов JSON, различные типы данных и эффективное индексирование. Масштабируемая архитектура сервиса с оптимизацией в оперативной памяти позволяет выполнять быструю оценку запросов к большим наборам документов.
Простое масштабирование вычислительных ресурсов базы данных
Масштабировать вычислительные ресурсы и ресурсы памяти в сторону увеличения или уменьшения можно путем создания новых инстансов реплик требуемого размера либо удаления существующих инстансов за несколько щелчков мышью в Консоли управления AWS. Масштабирование вычислительных ресурсов, как правило, занимает лишь несколько минут.
Автоматическое масштабирование хранилища
Amazon DocumentDB автоматически увеличивает размер тома хранилища при увеличении потребностей кластера в объеме хранилища. Объем тома хранилища может постепенно расширяться (с шагом 10 ГБ) до 4 ПиБ. Выделять избыточный объем хранилища на случай увеличения базы данных документов в будущем не требуется.
Реплики чтения с низкой задержкой
Для обработки большого количества запросов со стороны приложений можно увеличить пропускную способность чтения путем создания реплик чтения базы данных. Таких реплик у каждой БД может быть до пятнадцати. Реплики Amazon DocumentDB используют то же самое хранилище, что и исходный инстанс. Это позволяет уменьшить затраты и избавляет от необходимости производить операции записи на узлах‑реплики. В результате высвобождается дополнительная вычислительная мощность для обслуживания запросов чтения, а интервал задержки реплики в миллисекундах снижается – часто до однозначных чисел. При этом Amazon DocumentDB предоставляет единый адрес для запросов чтения, благодаря чему приложения могут подключаться без необходимости отслеживать добавления и удаления реплик.
Совместимость с MongoDB
Сервис Amazon DocumentDB совместим с драйверами и инструментами MongoDB 3.6, 4.0 и 5.0. Большую часть приложений, драйверов и инструментов, которые клиенты применяют при работе с нереляционными базами данных MongoDB с открытым исходным кодом, можно использовать в Amazon DocumentDB. Amazon DocumentDB эмулирует ответы, ожидаемые клиентом от сервера MongoDB, с помощью интерфейса API MongoDB 3.6, 4.0 и 5.0 (предоставляемого с открытым исходным кодом по лицензии Apache 2.0) на специализированной распределенной отказоустойчивой системе хранилищ с возможностью самостоятельного восстановления. Такая система обеспечивает производительность, масштабируемость и доступность, необходимые при работе с критически важными рабочими нагрузками MongoDB при любом масштабе. Подробнее о поддерживаемых API MongoDB.
Возможности геопространственных запросов
Благодаря возможностям геопространственных запросов клиентам Amazon DocumentDB доступно хранение и индексирование геопространственных данных, а также создание запросов к ним. Можно создавать индексы 2dsphere и использовать популярные геопространственные API MongoDB, такие как $nearSphere, $geoNear, $minDistance, $maxDistance, чтобы выполнять запросы к хранящимся в DocumentDB данным.
Транзакции ACID
ACID (атомарность, непротиворечивость, изолированность, долговечность) – это набор параметров транзакций базы данных, которые обеспечивают достоверность данных вне зависимости от ошибок, сбоев питания и других неполадок. Благодаря реализации совместимости с MongoDB 4.0 Amazon DocumentDB теперь поддерживает возможность выполнять транзакции ACID для нескольких документов, выражений, коллекций и баз данных одновременно.
Поддержка миграции
С помощью сервиса AWS Database Migration Service (DMS) клиенты могут абсолютно бесплатно (в течение полугода для каждого инстанса) и с минимальными простоями перенести свои базы данных MongoDB, размещенные как локально, так и в Amazon Elastic Compute Cloud (EC2), в сервис Amazon DocumentDB. DMS позволяет выполнить миграцию фрагментированного кластера или набора реплик MongoDB в Amazon DocumentDB. Подробнее о переносе реляционных и нереляционных баз данных в Amazon DocumentDB см. в разделе Миграция в Amazon DocumentDB.
Экономичность
Оплата по факту использования
При использовании Amazon DocumentDB у вас нет никаких предварительных обязательств. Вы платите почасово за каждый запущенный инстанс, а когда закончите работу с инстансом Amazon DocumentDB, то можете удалить его или приостановить. Необходимости выделять избыточный объем хранилища нет, поэтому оплате подлежит только тот объем, который фактически используется. Более подробные сведения см. на странице цен на Amazon DocumentDB.
Предсказуемые цены в любом масштабе
Amazon DocumentDB предлагает оптимизированную для ввода-вывода конфигурацию хранилища для тех, кто ищет предсказуемые цены. Конфигурация Amazon DocumentDB, оптимизированная для ввода-вывода база данных, которая обеспечивает снижение затрат на 40 % для приложений с интенсивным вводом-выводом, где плата за данные операции превышает 25 % от общих расходов на базу данных Amazon DocumentDB, оптимизированную для ввода-вывода. С помощью конфигурации Amazon DocumentDB, оптимизированной для ввода-вывода, вы можете эффективно устранить неопределенность переменных расходов на ввод-вывод в структуре выставления счетов. Вместо этого вы платите только за вычислительные ресурсы, хранение и резервное копирование, что обеспечивает предсказуемость и прозрачность цен.
Соотношение цены и производительности
Amazon DocumentDB позволяет выбирать между стандартной конфигурацией и конфигурацией хранилища, оптимизированной для ввода-вывода, для кластера баз данных. Гибкость позволяет максимизировать соотношение цены и качества, выбрав подходящую конфигурацию в соответствии с вашими потребностями. Если ваше приложение выполняет небольшое или умеренное количество операций ввода-вывода, следует выбрать стандартную конфигурацию. Если ваш вариант использования требует рабочих нагрузок со множеством операций ввода-вывода, вы можете выбрать конфигурацию хранилища, оптимизированную для ввода-вывода.
Полная управляемость
Автоматическое выделение ресурсов и настройка
Начать работу с Amazon DocumentDB очень просто. Достаточно запустить новый кластер Amazon DocumentDB с помощью Консоли управления AWS. Для инстансов Amazon DocumentDB предварительно настроен набор параметров и установок, соответствующих выбранному классу инстанса. Можно запустить кластер и подключить приложение. Процесс занимает несколько минут и не требует дополнительной настройки.
Мониторинг и метрики
Amazon DocumentDB предоставляет метрики Amazon CloudWatch для инстансов облачных баз данных. В Консоли управления AWS доступны для просмотра более 40 основных рабочих метрик кластера, включая использование вычислительных ресурсов, памяти и хранилища, пропускную способность запросов, счетчики операций MongoDB и активные соединения.
Автоматическая установка исправлений ПО
Amazon DocumentDB будет обновлять базу данных до последней версии ПО со всеми установленными исправлениями. Система управления версиями ядра базы данных позволяет указать в настройках, должны ли в кластере применяться исправления, и если да, то когда именно.
Высокий уровень безопасности и строгое соответствие требованиям
Изолирование сети
Amazon DocumentDB работает в виртуальном частном облаке (VPC), что позволяет изолировать кластер в собственной виртуальной сети и подключиться к локальной ИТ‑инфраструктуре с использованием виртуальных частных сетей (VPN) со стандартным шифрованием IPsec. Кроме того, конфигурация Amazon DocumentDB в VPC позволяет настроить параметры брандмауэра и управлять сетевым доступом к кластеру.
Авторизация
В Amazon DocumentDB реализована поддержка управления доступом на основе ролей (RBAC) с использованием встроенных и пользовательских ролей. RBAC позволяет принудительно применять рекомендованный доступ по принципу наименьших привилегий, ограничивая набор действий, которые разрешено выполнять пользователям. Amazon DocumentDB интегрирован с сервисом Управление идентификацией и доступом (IAM) AWS и позволяет управлять действиями пользователей и групп AWS IAM в отношении конкретных ресурсов Amazon DocumentDB, в том числе кластеров, инстансов, снимков состояния и групп параметров. Кроме того, сервис позволяет присваивать теги ресурсам Amazon DocumentDB и управлять действиями пользователей и групп IAM в отношении ресурсов, имеющих общий тег и значение тега.
Шифрование
Amazon DocumentDB поддерживает шифрование баз данных с использованием ключей, создаваемых и управляемых пользователем с помощью AWS Key Management Service (KMS). В кластере Amazon DocumentDB с шифрованием шифруются все данные, хранимые в базовой системе хранения, а также автоматические резервные копии, снимки состояния и реплики чтения в том же кластере. По умолчанию соединения между клиентом и Amazon DocumentDB шифруются при передаче данных с помощью TLS.
Сертификация на соответствие требованиям
Сервис Amazon DocumentDB разработан в соответствии с самыми строгими стандартами безопасности, что позволяет клиентам проверить наш уровень безопасности и выполнить свои обязательства по соответствию нормативным требованиям. Проверка Amazon DocumentDB показала его соответствие стандартам PCI DSS, ISO 9001, 27001, 27017 и 27018, SOC 1, 2 и 3, а также сертификации Health Information Trust Alliance Common Security Framework (HITRUST CSF). Кроме того, этот сервис соответствует требованиям HIPAA.
Высокая доступность
Глобальные кластеры
Глобальные кластеры Amazon DocumentDB обеспечивают аварийное восстановление в результате сбоев в масштабе региона и чтение глобальных данных с низкой задержкой. Сервис Amazon DocumentDB Global Clusters реплицирует данные в кластеры, расположенные в 5 регионах AWS, почти не влияя на производительность, со стандартной задержкой длиной менее одной секунды. Подробнее о настройке Global Clusters см. в руководстве пользователя Amazon DocumentDB.
Мониторинг и восстановление инстансов
Состояние кластера Amazon DocumentDB и его инстансов постоянно отслеживается. При выходе из строя инстанса, лежащего в основе базы данных, происходит автоматический перезапуск этого инстанса и сопутствующих процессов. Восстановление Amazon DocumentDB не требует воспроизведения журналов повтора базы данных, которое может занимать довольно много времени. В результате перезапуск инстанса обычно занимает не более 30 секунд. Кроме того, в Amazon DocumentDB кэш базы данных изолирован от ее процессов, благодаря чему он сохраняется при перезагрузке.
Возможность развертывания в нескольких зонах доступности с использованием реплик чтения
При выходе инстанса из строя Amazon DocumentDB автоматически осуществляет аварийную обработку отказа на одну из реплик, созданных в любой из трех зон доступности. Поддерживается создание до пятнадцати реплик. При отсутствии реплик Amazon DocumentDB в случае сбоя сервис Amazon DocumentDB автоматически попытается создать новый инстанс.
Отказоустойчивое и самовосстанавливающееся хранилище
Каждый блок тома хранилища в 10 ГБ шестикратно реплицирован в трех зонах доступности (AZ). Отказоустойчивое хранилище Amazon DocumentDB автоматически обрабатывает потерю до двух копий данных без снижения доступности базы данных для операций записи и до трех копий – без снижения доступности для операций чтения. Кроме того, хранилище Amazon DocumentDB является самовосстанавливающимся: блоки данных и диски постоянно проверяются на наличие ошибок и автоматически заменяются.
Непрерывные автоматические инкрементные резервные копии и восстановление на момент времени
Простая возможность резервного копирования базы данных в Amazon DocumentDB обеспечивает восстановление кластера на момент времени. Клиенты могут восстанавливать кластер по состоянию на любую секунду периода хранения до последних пяти минут использования. Настраиваемый период хранения автоматически созданных резервных копий может составлять до 35 дней. Автоматические резервные копии сохраняются в Простом сервисе хранения данных Amazon (Amazon S3), рассчитанном на надежность хранения на уровне 99,999999999 %. Резервное копирование в Amazon DocumentDB выполняется автоматически, инкрементно и непрерывно, не отражаясь на производительности кластера.
Снимки состояния кластера
Снимки состояния кластера – это инициированные пользователем резервные копии кластера, хранимые в Amazon S3 до момента их преднамеренного удаления. Они используют автоматизированные инкрементные снимки состояния для ускорения создания и уменьшения требований к хранилищу. При желании клиенты могут в любой момент создать новый кластер из снимка состояния кластера.
Генеративный искусственный интеллект и машинное обучение
Amazon DocumentDB предлагает возможности, позволяющие моделям машинного обучения и генеративного искусственного интеллекта работать с данными, хранящимися в Amazon DocumentDB, в режиме реального времени. Клиентам больше не нужно тратить время на управление отдельной инфраструктурой, написание кода для подключения к другому сервису и дублирование данных из основной базы.
Векторный поиск
С помощью векторного поиска для Amazon DocumentDB можно хранить, индексировать и искать миллионы векторов с миллисекундным временем отклика. Вектор – это числовое представление, отражающее семантическое значение неструктурированных данных, таких как текст, изображения и видео. Можно хранить векторные изображения из Amazon Bedrock, Amazon SageMaker и других сторонних или фирменных моделей. Узнайте, с чего начать, изучив нашу документацию по векторному поиску Amazon DocumentDB.
Машинное обучение без кода с Amazon DocumentDB и Amazon Sagemaker Canvas
Amazon DocumentDB интегрируется с Amazon SageMaker Canvas, что упрощает создание генеративных приложений с использованием данных, хранящихся в Amazon DocumentDB. Интеграция в консоль устраняет необходимость в подключении и доступе к Amazon DocumentDB, что позволяет ускорить разработку искусственного интеллекта и машинного обучения без необходимости писать код. В SageMaker Canvas вы можете создавать модели искусственного интеллекта и машинного обучения для классических сценариев использования, таких как регрессия и прогнозирование, или создавать решения посредством генеративного искусственного интеллекта, такие как производство контента, извлечение и суммирование текста. Ознакомьтесь с документацией Amazon DocumentDB по генеративному искусственному интеллекту, чтобы узнать больше.
Интеграция с нулевым использованием ETL НОВИНКА
Интеграция DocumentDB c сервисом Amazon OpenSearch с нулевым использованием ETL
Интеграция Amazon DocumentDB с сервисом Amazon OpenSearch с нулевым использованием ETL дает новые возможности для поиска (например, нечеткий или семантический поиск) в документах Amazon DocumentDB через API OpenSearch. Благодаря этой интеграции вы также можете выполнять поиск уникальных значений во всех коллекциях и на языках, отличных от английского. Теперь всего за несколько щелчков мышью в Консоли AWS вы можете легко синхронизировать данные из Amazon DocumentDB в сервис Amazon OpenSearch, избавляясь от необходимости писать код для извлечения, преобразования и загрузки данных.
Интеграция с нулевым использованием ETL выполняется через сервис Amazon OpenSearch Ingestion, который перемещает данные документов из Amazon DocumentDB в сервис Amazon OpenSearch. Он автоматически определяет формат данных в коллекциях Amazon DocumentDB и сопоставляет эти данные с сервисом Amazon OpenSearch для наиболее эффективных результатов поиска. Интеграция с нулевым использованием ETL позволяет консолидировать несколько коллекций Amazon DocumentDB в бессерверную коллекцию или управляемый кластер Amazon OpenSearch. Вы можете ознакомиться с нашей документацией по работе с интеграцией Amazon DocumentDB с нулевым использованием ETL на основе сервиса Amazon OpenSearch.
Посетите страницу цен на сервис Amazon DocumentDB (совместимый с MongoDB).
Получите мгновенный доступ к уровню бесплатного пользования AWS.
Начните разработку с помощью сервиса Amazon DocumentDB (с поддержкой совместимости с MongoDB) в консоли AWS.