Amazon Neptune ML

Простые, быстрые и точные прогнозы для графов

Обзор

Amazon Neptune ML – это новая возможность Neptune, в которой используются графовые нейронные сети (ГНС) – метод машинного обучения, специально разработанный для графов, с целью простого, быстрого и более точного прогнозирования на основе графовых данных. С помощью Neptune ML можно повысить точность большинства прогнозов для графов более чем на 50 % по сравнению с прогнозированием на основе неграфовых методов.

Составление точных прогнозов на графах с миллиардами взаимосвязей может быть сложной и трудоемкой задачей. Существующие подходы машинного обучения, такие как XGBoost, не могут эффективно работать с графами, поскольку они разработаны для табличных данных. Применение этих методов в работе с графами может занять много времени, потребовать специальных навыков от разработчиков и дать неоптимальные прогнозы.

Библиотека Deep Graph Library (DGL) с открытым исходным кодом, в создании которой участвует AWS, существенно упрощает применение глубокого обучения к графовым данным. Neptune ML автоматизирует непростую работу по выбору и обучению лучших для графовых данных моделей машинного обучения, а также позволяет пользователям запускать их на своих графах непосредственно с помощью API и запросов Neptune. Теперь вы можете создавать, обучать и применять машинное обучение к данным Neptune за несколько часов, а не недель, без необходимости изучать соответствующие технологии и новые инструменты.

Машинное обучение и генеративный искусственный интеллект

Neptune ML автоматически создает, обучает и применяет модели машинного обучения к вашим графовым данным. Он использует библиотеку DGL, автоматически выбирая и обучая наилучшую для вашей рабочей нагрузки модель машинного обучения, чтобы на ее основе вы могли делать прогнозы для графовых данных за несколько часов, а не недель.

В Neptune ML используются графовые нейронные сети (ГНС) – современный метод машинного обучения, применяемый к графовым данным и позволяющий анализировать миллиарды взаимосвязей в графах, чтобы вы могли делать более точные прогнозы.

* Согласно опубликованным исследованиям Стэнфордского университета, Neptune ML использует ГНС для составления прогнозов, на 50 % более точных, чем машинное обучение без графов.

LangChain – это платформа Python с открытым исходным кодом, разработанная с целью упростить создание приложений с использованием больших языковых моделей (LLM). Благодаря интеграции Neptune с LangChain разработчики могут использовать платформу LangChain с открытым исходным кодом, тем самым упрощая создание контекстнозависимых приложений.

С помощью Neptune и LangChain вы можете получать ответы на основе предоставленного контекста и запрашивать графовую базу данных Neptune, используя язык запросов openCypher. В частности, можно использовать цепочку вопросов и ответов Neptune openCypher для перевода вопросов на английском языке в запросы openCypher и получения ответов, понятных человеку, например на вопрос «Сколько исходящих рейсов в аэропорту Остина?»

Дополнительные сведения о цепочке вопросов и ответов Neptune openCypher см. в документации LangChain с открытым исходным кодом.

LlamaIndex – это платформа данных с открытым исходным кодом, предназначенная для подключения пользовательских источников данных с большими языковыми моделями (LLM) и поддерживающая использование графов знаний с LLM.

Благодаря LlamaIndex вы можете использовать сервис Neptune как хранилище графов или векторов, а также помощью таких методик, как GraphRAG, создавать приложения с генеративным искусственным интеллектом.

Примеры использования

Компании теряют миллионы и даже миллиарды долларов в результате мошенничества и хотят выявлять злоумышленников, а также используемые ими учетные записи, устройства, IP-адреса или кредитные карты, чтобы минимизировать потери. Вы можете фиксировать взаимодействие субъектов (пользователя, устройства или карты), используя графы, и выявлять агрегированные данные, например, когда кто-то инициирует несколько мини-транзакций или использует разные учетные записи, которые могут быть мошенническими.

Подробнее

С помощью набора устройств и идентификаторов граф идентификации обеспечивает единое унифицированное представление о текущих и потенциальных клиентах на основе их взаимодействия с продуктом или веб-сайтом. Организации используют графы идентификации для персонализации в реальном времени и таргетинга рекламы для миллионов пользователей. Neptune ML автоматически рекомендует определенным клиентам дальнейшие шаги или скидки на продукты на основе таких данных, как история поиска на разных устройствах или готовность к покупке.

Подробнее

Графы знаний объединяют и интегрируют информационные активы организации, а также делают их доступнее для всех ее членов. Neptune ML может выявлять недостающие ссылки в источниках данных и идентифицировать похожие объекты, чтобы облегчить вам получение знаний.

Подробнее

Традиционно для составления рекомендаций по продуктам используются управляемые вручную аналитические сервисы. Neptune ML может определять новые взаимосвязи непосредственно на графовых данных и легко рекомендовать подписаться на других пользователей или приобрести игру либо продукт, которые могут быть интересны игроку.

Цены

Предварительные вложения не требуются. Вы платите только за используемые ресурсы AWS, такие как Amazon SageMaker, Neptune и Amazon Simple Storage Service (Amazon S3).

Начало работы

Самый простой способ начать работу с Neptune ML – использовать готовые шаблоны быстрого запуска AWS CloudFormation. Вы также можете ознакомиться с записными книжками Neptune ML и увидеть комплексные примеры классификации узлов и их регрессии, а также прогнозирования ссылок с помощью готового стека CloudFormation.

Создать стек Neptune ML