Введение

Amazon Neptune позволяет создавать сложные интерактивные приложения на основе графов, способные опрашивать миллиарды связей за считаные миллисекунды. Запросы SQL к тесно связанным данным отличаются высокой сложностью и с трудом поддаются оптимизации для повышения производительности. Amazon Neptune позволяет использовать вместо этого популярные языки запросов к графам Apache TinkerPop Gremlin и W3C SPARQL, которые дают возможность просто составлять запросы, способные эффективно работать со связанными данными. Это значительно упрощает код и ускоряет создание приложений для обработки связей.

Сервис Amazon Neptune обеспечивает доступность на уровне более 99,99 %. Он увеличивает производительность и доступность баз данных за счет тесной интеграции ядра базы данных с виртуализированным уровнем хранилища на основе SSD, который специально создан для рабочих нагрузок баз данных. Хранилище Amazon Neptune является отказоустойчивым и самовосстанавливающимся, а неисправности дисковых накопителей устраняются в фоновом режиме без потери доступа к базе данных. Amazon Neptune автоматически обнаруживает сбои базы данных и перезапускает ее без необходимости восстановления после сбоя или воссоздания кэша базы данных. При сбое всего инстанса Amazon Neptune автоматически осуществит аварийную обработку отказа на одну из реплик чтения, которых может насчитываться до пятнадцати.

Инстанс базы данных Amazon Neptune можно быстро запустить всего за несколько щелчков мышью в консоли управления Neptune. Amazon Neptune масштабирует хранилище автоматически, увеличивая его и перераспределяя операции ввода-вывода для обеспечения стабильной работы без необходимости выделения избыточных ресурсов.

Высокая производительность и масштабируемость

Высокая пропускная способность и низкая задержка запросов к графам
Amazon Neptune – это специально разработанное высокопроизводительное ядро графовой базы данных. Amazon Neptune обеспечивает эффективное хранение графовых данных и навигацию по ним. Масштабируемая архитектура с оптимизацией в оперативной памяти позволяет выполнять быструю оценку запросов к большим графам. Amazon Neptune поддерживает Gremlin или SPARQL, что позволяет с легкостью составлять эффективные запросы.

Простое масштабирование вычислительных ресурсов базы данных
Масштабировать вычислительные ресурсы и ресурсы памяти рабочего кластера в сторону увеличения или уменьшения можно за несколько щелчков мышью в Консоли управления AWS путем создания новых инстансов реплик требуемого размера либо удаления существующих инстансов. Масштабирование вычислительных ресурсов, как правило, занимает лишь несколько минут.

Автоматически масштабируемое хранилище
Amazon Neptune автоматически увеличивает размер тома базы данных при увеличении потребностей в объеме хранилища. Объем тома будет возрастать инкрементно с 10 ГБ до 64 ТБ. Нет необходимости выделять избыточный объем хранилища на случай увеличения базы данных в будущем.

Реплики чтения с низкой задержкой
Для поддержки больших объемов запросов приложений можно увеличить пропускную способность чтения путем создания реплик чтения базы данных, которых может насчитываться до пятнадцати. Реплики Amazon Neptune используют то же самое хранилище, что и исходный инстанс. Это позволяет уменьшить затраты и избавляет от необходимости производить операции записи на узлах реплики. В результате высвобождается дополнительная вычислительная мощность для обслуживания запросов чтения, а интервал задержки реплики в миллисекундах снижается – часто до однозначных цифр. При этом Amazon Neptune предоставляет единый адрес для запросов чтения, благодаря чему приложения могут подключаться без отслеживания добавления и удаления реплик.

Высокая доступность и надежность

Мониторинг и восстановление инстансов
Состояние базы данных Amazon Neptune и лежащего в ее основе инстанса EC2 постоянно отслеживается. При выходе из строя инстанса, лежащего в основе базы данных, происходит автоматический перезапуск базы данных и сопутствующих процессов. Восстановление Amazon Neptune не требует воспроизведения журналов повтора базы данных, которое может занимать довольно много времени. В результате перезапуск инстанса обычно занимает не более 30 секунд. Кроме того, Amazon Neptune изолирует буферный кэш от процессов базы данных, благодаря чему он сохраняется при перезагрузке.

Возможность развертывания в нескольких зонах доступности с использованием реплик чтения
При выходе инстанса из строя Amazon Neptune автоматически осуществляет аварийную обработку отказа на одну из реплик, созданных в любой из трех зон доступности. Поддерживается создание до пятнадцати реплик. При отсутствии реплик в случае сбоя Amazon Neptune автоматически попытается создать новый инстанс базы данных.

Отказоустойчивое и самовосстанавливающееся хранилище
Каждый блок тома базы данных в 10 ГБ шестикратно реплицируется в трех зонах доступности. Отказоустойчивое хранилище Amazon Neptune автоматически обрабатывает потерю до двух копий данных без снижения доступности базы данных для операций записи и до трех копий – без снижения доступности для операций чтения. Кроме того, хранилище Amazon Neptune является самовосстанавливающимся: блоки данных и диски постоянно проверяются на наличие ошибок и автоматически заменяются.

Автоматические и непрерывные инкрементные резервные копии и восстановление на момент времени
Возможность резервного копирования в Amazon Neptune обеспечивает восстановление инстанса на момент времени. Это позволяет восстановить базу данных на любой момент периода хранения (в секундах) до последних пяти минут использования. Настраиваемый период хранения автоматически созданных резервных копий может составлять до тридцати пяти дней. Автоматические резервные копии сохраняются в Amazon S3, рассчитанном на надежность хранения на уровне 99,999999999 %. Резервное копирование Amazon Neptune осуществляется автоматически, инкрементно и непрерывно, не отражаясь на производительности базы данных.

Снимки состояния базы данных
Снимки состояния базы данных – это инициированные пользователем резервные копии инстанса, которые хранятся в Amazon S3 до момента их намеренного удаления пользователем. Они используют автоматизированные инкрементные снимки состояния для ускорения их создания и уменьшения требований к хранилищу. Из снимка состояния базы данных можно в любой момент создать новый инстанс.

API Open Graph

Поддержка Property Graph и Apache TinkerPop Gremlin
Графы, построенные по модели Property Graph, пользуются популярностью, поскольку хорошо знакомы разработчикам, привыкшим к реляционным моделям данных. Язык запросов Gremlin позволяет осуществлять быстрый обход графов, построенных по модели Property Graph. Amazon Neptune поддерживает модель Property Graph на основе открытого языка запросов Apache TinkerPop Gremlin и предоставляет сервер Gremlin Websockets с поддержкой TinkerPop версии 3.3. С помощью Amazon Neptune можно осуществлять быстрый обход графов, построенных по модели Property Graph. Существующие приложения на основе Gremlin могут быть с легкостью адаптированы для Amazon Neptune за счет изменения сервисной конфигурации Gremlin таким образом, чтобы она указывала на инстанс Amazon Neptune.

Поддержка W3C Resource Description Framework (RDF) 1.1 и SPARQL 1.1
RDF пользуется популярностью, поскольку обладает достаточной гибкостью для создания моделей сложных информационных доменов. В рамках RDF доступен ряд готовых бесплатных или публичных наборов данных, включая Wikidata и PubChem – базу данных химических молекул. Amazon Neptune поддерживает стандарты семантической паутины W3C RDF 1.1 и SPARQL 1.1 (Query и Update), а также предоставляет адрес HTTP REST, использующий протокол SPARQL 1.1. В Amazon Neptune адрес SPARQL может использоваться как для существующих, так и для новых приложений графов.

Высокий уровень безопасности

Изолирование сети
Amazon Neptune работает в облаке Amazon VPC, что позволяет изолировать базу данных в собственной виртуальной сети и подключаться к локальной ИТ-инфраструктуре с использованием IPsec VPN со стандартным шифрованием. Кроме того, конфигурация Amazon Neptune в VPC позволяет настроить параметры брандмауэра и управлять сетевым доступом к инстансам базы данных.

Разрешения на уровне доступа к ресурсам
Сервис Amazon Neptune интегрирован с AWS Identity and Access Management (IAM) и позволяет управлять действиями пользователей AWS IAM и групп в отношении конкретных ресурсов Amazon Neptune, включая инстансы базы данных, снимки состояния базы данных, группы параметров базы данных, подписки на события базы данных и группы настроек базы данных. Кроме того, сервис позволяет присваивать ресурсам Amazon Neptune теги и управлять действиями пользователей и групп IAM в отношении ресурсов, отмеченных одинаковым тегом (и с одинаковым значением тега). Например, можно настроить правила IAM таким образом, чтобы разработчики могли изменять инстансы базы данных с тегом Development, но только администраторы базы данных имели право изменять и удалять инстансы базы данных с тегом Production.

Шифрование
Amazon Neptune поддерживает шифрование баз данных с использованием ключей, создаваемых и управляемых с помощью AWS Key Management Service (KMS). В инстансе базы данных с шифрованием Amazon Neptune шифруются все данные, находящиеся в базовом хранилище, а также автоматические резервные копии, снимки состояния и реплики в том же кластере. Для защиты данных при передаче Amazon Neptune использует TLS (AES-256).

Расширенные возможности аудита
Amazon Neptune позволяет вести журнал событий базы данных с минимальным воздействием на ее производительность. В дальнейшем возможен анализ журналов для целей безопасности, управления, администрирования базы данных, обеспечения соответствия требованиям законодательства и т. д. Кроме того, возможен мониторинг активности посредством отправки журналов аудита в Amazon CloudWatch.

Полностью управляемый сервис

Простота использования
Начать работу с Amazon Neptune очень просто. Достаточно запустить новый инстанс базы данных Amazon Neptune с помощью Консоли управления AWS. Для инстансов баз данных Amazon Neptune предварительно задан набор параметров и установок, соответствующих выбранному классу инстанса. Запустить инстанс базы данных и подключить приложение можно всего за несколько минут без дополнительной настройки. Группы параметров базы данных предоставляют возможность точного управления и подробного конфигурирования.

Простота эксплуатации
С Amazon Neptune использовать высокопроизводительную графовую базу данных очень легко. Не требуется создавать пользовательские индексы данных графа. Amazon Neptune предусматривает ограничения максимального времени ожидания и потребления памяти для снижения нагрузки со стороны запросов, потребляющих слишком много ресурсов.

Мониторинг и метрики
Amazon Neptune предоставляет метрики Amazon CloudWatch для инстансов баз данных. В Консоли управления AWS доступны для просмотра более 20 основных рабочих метрик инстанса базы данных, включая использование вычислительных ресурсов, памяти и хранилища, пропускную способность запросов и активные соединения.

Автоматическая установка исправлений ПО
Сервис Amazon Neptune обновляет базы данных, применяя последние версии исправлений. Система управления версиями ядра базы данных позволяет указать в настройках, должны ли в инстансе применяться исправления, и если да, то когда именно.

Уведомления о событиях базы данных
Amazon Neptune может отправлять оповещения о важных событиях базы данных, например о выполнении автоматической аварийной обработки отказа, по электронной почте или с помощью SMS. Подписаться на получение уведомлений о различных событиях, связанных с базами данных Amazon Neptune, можно в Консоли управления AWS.

Быстрое клонирование баз данных
Amazon Neptune поддерживает быстрое и эффективное клонирование. К примеру, клонирование многотерабайтных кластеров баз данных занимает всего несколько минут. Клонирование актуально в самых разных ситуациях, включая разработку и тестирование приложений, обновление баз данных и выполнение аналитических запросов. Немедленная доступность данных позволяет значительно ускорить реализацию проектов по разработке и обновлению программного обеспечения, а также повысить точность аналитики.

Клонировать базу данных Amazon Neptune можно за пару щелчков мышью в Консоли управления, не затрагивая рабочую среду. Клон базы данных распределяется и реплицируется на 3 зоны доступности.

Быстрая параллельная пакетная загрузка данных

Пакетная загрузка данных Property Graph
Amazon Neptune поддерживает быструю параллельную пакетную загрузку данных Property Graph, хранящихся в Amazon S3. Указать расположение данных в Amazon S3 можно с помощью интерфейса REST. Он использует формат CSV для загрузки данных в узлы и ребра. Дополнительную информацию см. в документации Amazon Neptune по пакетной загрузке данных Property Graph.

Пакетная загрузка данных RDF
Amazon Neptune поддерживает быструю параллельную загрузку данных RDF, хранящихся в Amazon S3. Указать расположение данных в Amazon S3 можно с помощью интерфейса REST. Поддерживаются варианты сериализации N-Triples (NT), N-Quads (NQ), RDF/XML и Turtle RDF 1.1. Дополнительную информацию см. в документации Amazon Neptune по пакетной загрузке данных RDF.

Экономичность

Платите только за то, чем пользуетесь
В Amazon Neptune не предусмотрено никаких предварительных обязательств: вы просто платите по почасовому тарифу за каждый запущенный инстанс. Если вы решите прекратить использование инстанса базы данных, его можно легко удалить. Нет необходимости выделять избыточный объем хранилища, поэтому вы платите только за тот объем, который фактически используете. Подробные сведения см. на странице цен на Amazon Neptune

Подробнее о ценах на Amazon Neptune

Перейти на страницу цен