Возможности

Высокая производительность и масштабируемость

Открыть все

С помощью нескольких шагов в консоли управления AWS можно увеличить или уменьшить объем вычислительных ресурсов и ресурсов памяти, используемых в производственном кластере. С помощью базы данных Neptune можно выполнять масштабирование, создавая новые инстансы реплик нужного размера или удаляя инстансы. Масштабирование вычислительных ресурсов, как правило, занимает лишь несколько минут.

В базе данных Neptune используется распределенная архитектура хранилища с общим доступом, объем которого автоматически растет по мере увеличения потребностей носителей данных. Данные Neptune хранятся на кластерном томе с высокой доступностью в нескольких зонах доступности (Multi-AZ). Когда создается кластер базы данных Neptune, для него выделяется отдельный сегмент объемом 10 ГиБ. Когда объем данных растет и начинает превышать текущий предоставленный объем хранилища, Neptune автоматически расширяет том кластера, добавляя новые сегменты. Максимальный объем, до которого может увеличиться объем кластера Neptune, составляет 128 ТиБ в поддерживаемых регионах AWS, за исключением Китая и GovCloud. Выделять избыточный объем хранилища на случай увеличения базы данных в будущем не требуется.

При использовании базы данных Neptune для обработки большого количества запросов со стороны приложений можно увеличить пропускную способность чтения путем создания реплик чтения базы данных. У каждой базы данных может быть до 15 таких реплик. Реплики Neptune используют то же самое хранилище, что и исходный инстанс. Это позволяет уменьшить затраты и избавляет от необходимости производить операции записи на узлах реплики. В результате высвобождается дополнительная вычислительная мощность для обслуживания запросов чтения, а интервал задержки реплики в миллисекундах снижается, часто до однозначных чисел. При этом Neptune предоставляет единый адрес для запросов чтения, благодаря чему приложения могут подключаться без отслеживания добавления и удаления реплик.

Neptune – это специально разработанная высокопроизводительная графовая база данных. База данных Neptune обеспечивает эффективное хранение графовых данных и навигацию по ним. Масштабируемая архитектура с оптимизацией в оперативной памяти позволяет выполнять быструю оценку запросов к большим графам. С базой данных Neptune можно использовать Gremlin, openCypher или SPARQL, что позволяет с легкостью составлять эффективные запросы. С помощью аналитики Neptune можно использовать openCypher.

Высокая доступность и надежность

Открыть все

Глобальная база данных Amazon Neptune разработана для глобально распределенных приложений, что позволяет одной базе данных Neptune охватывать несколько регионов. Она реплицирует данные графа с минимальным влиянием на производительность базы данных, обеспечивает быстрое локальное чтение с низкой задержкой в каждом регионе и аварийное восстановление в случае сбоев в масштабах региона.

При выходе инстанса из строя Neptune автоматически осуществляет резервное переключение в целях отказоустойчивости на одну из реплик, созданных в любой из трех зон доступности. Поддерживается создание до 15 реплик. При отсутствии реплик в случае сбоя Neptune автоматически попытается создать новый инстанс базы данных.

Состояние базы данных Neptune и лежащего в ее основе инстанса Amazon EC2 постоянно отслеживается. При выходе из строя инстанса, лежащего в основе базы данных, происходит автоматический перезапуск базы данных и сопутствующих процессов. Восстановление Amazon Neptune не требует воспроизведения журналов повтора базы данных, которое может занимать довольно много времени. В результате перезапуск инстанса обычно занимает не более 30 секунд. Кроме того, буферный кэш изолирован от собственных процессов базы данных, благодаря чему он сохраняется при перезагрузке базы данных.

В базе данных Neptune каждый фрагмент тома базы данных объемом 10 ГиБ надежно распределен между тремя зонами доступности. Отказоустойчивое хранилище базы данных Neptune автоматически обрабатывает потерю до двух копий данных без снижения доступности базы данных для операций записи и до трех копий без снижения доступности для операций чтения. Кроме того, хранилище базы данных Neptune является самовосстанавливающимся: блоки данных и диски постоянно проверяются на наличие ошибок и автоматически заменяются.

Возможность резервного копирования в базе данных Neptune обеспечивает восстановление инстанса на момент времени. Это позволяет восстановить базу данных на любой момент периода хранения (до секунды) до последних 5 минут использования. Настраиваемый период хранения автоматически созданных резервных копий может составлять до 35 дней. Автоматические резервные копии сохраняются в сервисе Amazon S3, рассчитанном на надежность на уровне 99,999999999 %. Резервное копирование Neptune осуществляется автоматически, инкрементно и непрерывно, не отражаясь на производительности базы данных.

Снимки состояния базы данных – это инициированные пользователем резервные копии инстанса, которые хранятся в Amazon S3 до момента их намеренного удаления пользователем. Они используют автоматизированные инкрементные снимки состояния для ускорения создания и уменьшения требований к хранилищу. Из снимка состояния базы данных можно в любой момент создать новый инстанс.

Высокий уровень безопасности

Открыть все

База данных Neptune работает в Amazon Virtual Private Cloud (Amazon VPC), что позволяет изолировать базу данных в своей виртуальной сети и подключиться к локальной ИТ-инфраструктуре с использованием IPsec VPN со стандартным шифрованием. Кроме того, конфигурация Neptune в VPC позволяет настроить параметры брандмауэра и управлять сетевым доступом к инстансам базы данных.

Сервис Neptune интегрирован с Управлением идентификацией и доступом AWS (IAM) и позволяет управлять действиями пользователей IAM и групп в отношении конкретных ресурсов Neptune, включая инстансы базы данных, снимки состояния базы данных, группы параметров базы данных, подписки на события базы данных и группы настроек базы данных. Кроме того, сервис позволяет присваивать ресурсам Neptune теги и управлять действиями пользователей и групп IAM в отношении ресурсов, отмеченных одинаковым тегом (и с одинаковым значением тега). Например, можно настроить правила IAM таким образом, чтобы разработчики могли изменять инстансы базы данных с тегом Development, но только администраторы базы данных имели право изменять и удалять инстансы базы данных с тегом Production.

Neptune предоставляет точный доступ пользователям, получающим API плоскости данных Neptune с помощью IAM для выполнения действий с данными графа, таких как чтение, запись и удаление данных из графа, и действий, не связанных с данными графа, таких как запуск и мониторинг деятельности Neptune ML и проверка статуса текущей деятельности плоскости данных. Например, создайте политику с доступом «только чтение» для аналитиков данных, которым не нужно манипулировать данными графа, политику с доступом «чтение и запись» для разработчиков, использующих граф для своих приложений, и политику для специалистов по анализу данных, которым нужен доступ к командам Neptune ML.

Neptune поддерживает шифрование данных при передаче с использованием TLS версии 1.2. Neptune поддерживает шифрование баз данных с использованием ключей, создаваемых и управляемых с помощью Сервиса управления ключами AWS (AWS KMS). В инстансе базы данных с шифрованием Neptune шифруются все данные, находящиеся в базовом хранилище, а также автоматические резервные копии, снимки состояния и реплики в рамках одного кластера.

Neptune позволяет вести журнал событий базы данных с минимальным воздействием на ее производительность. Впоследствии журналы можно проанализировать для управления базами данных, обеспечения безопасности, корпоративного управления, соблюдения нормативных требований и других целей. Кроме того, для мониторинга активности можно отправлять журналы аудита в Amazon CloudWatch.

Neptune охватывает более 20 международных стандартов соответствия: от FedRAMP (уровни Moderate и High) до SOC (1, 2, 3), – а также соответствует требованиям HIPAA. Полный список стандартов, которым соответствует Neptune, можно найти в списке Сервисы AWS в программе соответствия требованиям.

Экономичность

Открыть все

В Neptune не предусмотрено никаких предварительных обязательств: вы платите по почасовому тарифу за каждый запущенный инстанс или за ресурсы базы данных, которые используются для бессерверных вычислений. Если вы решите прекратить использование инстанса базы данных, его можно удалить. Необходимости выделять избыточный объем хранилища нет, поэтому оплате подлежит только тот, который фактически используется. Подробные сведения см. на странице цен на Neptune.

Полностью управляемый сервис

Открыть все

Чтобы начать работу с Neptune, достаточно запустить новый инстанс базы данных Neptune или граф аналитики Neptune с помощью консоли управления AWS. Для инстансов баз данных Neptune предварительно задан набор параметров и установок, соответствующих выбранному классу инстанса. Запустить инстанс базы данных и подключить приложение можно всего за несколько минут без дополнительной настройки. Группы параметров базы данных позволяют осуществлять детальное управление и точную настройку базы данных.

Neptune предоставляет метрики CloudWatch для инстансов баз данных. В консоли доступны для просмотра более 20 основных рабочих метрик инстанса базы данных, включая использование вычислительных ресурсов, памяти и хранилища, пропускную способность запросов и активные соединения.

Сервис Neptune обновляет базы данных, применяя последние версии исправлений. Система управления версиями ядра базы данных позволяет указать в настройках, должны ли в инстансе применяться исправления, и если да, то когда именно.

Neptune может отправлять оповещения о важных событиях баз данных, например о выполнении автоматического резервного переключения, по электронной почте или с помощью SMS. Подписаться на получение уведомлений о различных событиях, связанных с базами данных Neptune, можно в консоли.

Neptune поддерживает быстрое и эффективное клонирование. Например, клонирование кластеров баз данных объемом в несколько терабайтов занимает лишь пару минут. Клонирование актуально в самых разных ситуациях, включая разработку и тестирование приложений, обновление баз данных и выполнение аналитических запросов. Немедленная доступность данных позволяет значительно ускорить реализацию проектов по разработке и обновлению программного обеспечения, а также повысить точность аналитики.

Клонировать базу данных Neptune можно за несколько шагов в консоли, не затрагивая рабочую среду. Клон базы данных будет распределен по трем зонам доступности и реплицирован в них.

Агентный ИИ и машинное обучение

Открыть все

Аналитика Neptune поддерживает алгоритмы для поиска путей, обнаружения сообществ (кластеризация), определения важных данных (централизация) и количественной оценки сходств. Алгоритмы поиска путей эффективно определяют кратчайший или наиболее оптимальный маршрут между двумя узлами. Алгоритмы поиска путей позволяют моделировать реальные ситуации, такие как дорожные сети или социальные сети, в виде взаимосвязанных узлов и краев. Поиск кратчайших или наиболее оптимальных путей между различными точками имеет решающее значение в таких приложениях, как планирование маршрутов для систем GPS, оптимизация логистики и даже при решении сложных задач в таких областях, как биология или инженерия.

Алгоритмы обнаружения сообществ вычисляют значимые группы или кластеры узлов в сети, выявляя скрытые закономерности и структуры, позволяющие понять организацию и динамику сложных систем. Это полезно в таких областях, как анализ социальных сетей, биология (для определения функциональных модулей в сетях белков взаимодействий) и даже для понимания потока информации и распространения влияния в различных областях.

Алгоритмы централизации помогают определить наиболее влиятельные или важные узлы в сети, предоставляя аналитические данные о ключевых игроках или критических точках взаимодействия. Это полезно в таких областях, как анализ социальных сетей, где они помогают выявить влиятельных лиц, или в транспортных сетях, где они помогают определить важнейшие узлы для эффективной маршрутизации и распределения ресурсов.

Алгоритмы сходства графов позволяют сравнивать и анализировать структурные сходства или различия между различными графовыми структурами, позволяя понять взаимосвязи, закономерности и сходства в различных наборах данных. Это имеет огромное значение в различных областях, таких как биология (для сравнения молекулярных структур), социальные сети (для выявления похожих сообществ) и системы рекомендаций (для предложения похожих элементов на основе предпочтений пользователей).

Neptune ML работает на базе SageMaker, где используются графовые нейронные сети (GNN), метод машинного обучения, специально разработанный для графов, для быстрого и более точного прогнозирования с применением данных графов. С помощью Neptune ML можно повысить точность большинства прогнозов для графов более чем на 50 % по сравнению с прогнозированием на основе неграфовых методов.

Составление точных прогнозов на графах с миллиардами взаимосвязей может быть сложной и трудоемкой задачей. Существующие подходы машинного обучения, такие как XGBoost, не могут эффективно работать с графами, поскольку они разработаны для табличных данных. Применение этих методов в работе с графами может занять много времени, потребовать специальных навыков от разработчиков и дать неоптимальные прогнозы.

Производительность разработчика

Открыть все

Графы свойств пользуются популярностью, поскольку хорошо знакомы разработчикам, привыкшим к реляционным моделям данных. Язык запросов Gremlin позволяет осуществлять быстрый обход графов, построенных по модели Property Graph. Neptune поддерживает модель графов свойств на основе открытого языка запросов Apache TinkerPop Gremlin и предоставляет сервер Gremlin Websockets с поддержкой TinkerPop версии 3.3. С помощью Neptune можно осуществлять быстрый обход графов, построенных по модели Property Graph. Существующие приложения на основе Gremlin могут быть с легкостью адаптированы для Neptune за счет изменения сервисной конфигурации Gremlin таким образом, чтобы она указывала на инстанс Neptune.

Среда описания ресурса (RDF) пользуется популярностью, поскольку обладает достаточной гибкостью для создания моделей сложных информационных доменов. В рамках RDF доступен ряд готовых бесплатных или публичных наборов данных, включая Wikidata и PubChem – базу данных химических молекул. Neptune поддерживает стандарты семантической паутины W3C RDF 1.1 и SPARQL 1.1 (Query и Update), а также предоставляет адрес HTTP REST, использующий протокол SPARQL 1.1. В Neptune адрес SPARQL может использоваться как для существующих, так и для новых приложений графов.

Neptune поддерживает создание графовых приложений с помощью openCypher, который в настоящее время является одним из самых популярных языков запросов для разработчиков, работающих с графовыми базами данных. Синтаксис openCypher, созданный на основе SQL, популярен среди разработчиков, бизнес-аналитиков и специалистов по работе с данными, поскольку он обеспечивает привычную структуру для составления запросов в графовых приложениях. Для базы данных Neptune языки запросов openCypher и Gremlin можно использовать вместе для обработки одних и тех же данных Property Graph. Поддержка openCypher совместима с протоколом Bolt, чтобы можно было продолжать запускать приложения, использующие протокол Bolt для подключения к Neptune.

Neptune поддерживает быструю параллельную пакетную загрузку данных графа свойств, хранящихся в Amazon S3. Указать расположение данных в Amazon S3 можно с помощью интерфейса REST. Здесь используется формат CSV для загрузки данных в узлы и ребра. Дополнительную информацию см. в документации Neptune по пакетной загрузке данных графа свойств.

База данных Neptune поддерживает быструю параллельную загрузку данных RDF, хранящихся в Amazon S3. Указать расположение данных в Amazon S3 можно с помощью интерфейса REST. Поддерживаются варианты сериализации N-Triples (NT), N-Quads (NQ), RDF/XML и Turtle RDF 1.1. Дополнительную информацию см. в документации Neptune по пакетной загрузке данных RDF.

Функции Amazon Neptune

Высокая производительность и масштабируемость

Высокая доступность и надежность

Высокий уровень безопасности

Экономичность

Полностью управляемый сервис

Агентный ИИ и машинное обучение

Производительность разработчика

Дальнейшие шаги

Пройдите практический обучающий курс

Ознакомьтесь с Neptune

Зарегистрировать бесплатный аккаунт

Начните разработку в консоли

Подробнее

Ресурсы

Разработчики

Поддержка

Функции Amazon Neptune

Высокая производительность и масштабируемость

Простое масштабирование вычислительных ресурсов базы данных

Автоматически масштабируемое хранилище

Реплики чтения с небольшой задержкой

Высокая пропускная способность и низкая задержка запросов к графам

Высокая доступность и надежность

Глобальная база данных

Возможность развертывания в нескольких зонах доступности с использованием реплик чтения

Мониторинг и восстановление инстансов

Отказоустойчивое и самовосстанавливающееся хранилище

Непрерывные автоматические инкрементные резервные копии и восстановление на момент времени

Снимки состояния базы данных

Высокий уровень безопасности

Изолирование сети

Разрешения на уровне доступа к ресурсам

Точный контроль доступа

Шифрование

Расширенные возможности аудита

Широкий охват программ по обеспечению соответствия требованиям

Экономичность

Оплата по факту использования

Полностью управляемый сервис

Простота использования

Мониторинг и метрики

Автоматическая установка исправлений ПО

Уведомления о событиях базы данных

Быстрое клонирование баз данных

Агентный ИИ и машинное обучение

Графовые алгоритмы для аналитики Neptune

Машинное обучение

Производительность разработчика

Поддержка Apache TinkerPop Gremlin для графов свойств

Поддержка RDF 1.1 и SPARQL 1.1 от W3C

Поддержка OpenCypher версии 9 для графа свойств

Пакетная загрузка данных Property Graph

Пакетная загрузка данных RDF

Дальнейшие шаги

Пройдите практический обучающий курс

Ознакомьтесь с Neptune

Зарегистрировать бесплатный аккаунт

Начните разработку в консоли

Подробнее

Ресурсы

Разработчики

Поддержка