发布于: Jun 7, 2022

您现在可以使用开源 Python 集成对存储在 Amazon Neptune 中的图形数据运行图形分析和机器学习任务,从而简化数据科学和 ML 工作流程。通过此集成,您可以在任何 Python 环境(例如本地 Jupyter Notebook 实例、Amazon SageMaker StudioAWS Lambda 或其他计算资源) 使用 Pandas DataFrames 读写存储在 Neptune 中的图形数据。然后,您可以使用 iGraphNetworkXcuGraph 等开源库运行图算法,例如 PageRank 和 Connected Components。

今天发布的功能通过简化工作流程来帮助客户更快地构建和创新,从而为知识图谱、欺诈检测、实体解析和安全状况管理等用例提取分析见解。例如,您可以使用 NetworkX 对 Neptune 数据运行 Connected Components 算法,以识别强关联的用户社区。然后,您可以运行 PageRank 来查找每个社区中最具影响力的用户,并在 Neptune 中为这些用户添加“最具影响力”标签。您还可以使用诸多 Python 库,例如使用 XGBoost 来计算嵌入或对图形数据进行预测,使用 SageMaker Python SDK 来训练和部署机器学习模型,或者使用 Deep Graph Library(今天随 Neptune ML 提供)。

要开始使用,您可以使用 AWS 管理控制台或 AWS CLI 预置一个由 SageMaker 托管的 Neptune Notebook。要了解更多信息,请参阅开源文档和三个将图形分析用于欺诈集团识别合成身份运输物流优化的新数据科学教程。

该集成现已在支持使用 Amazon Neptune 的所有区域推出。使用此集成不会产生额外费用。客户只需为运行 Neptune 集群和托管 Neptune Notebook 的 SageMaker Notebook 实例而预置的资源付费。有关定价和区域可用性的更多信息,请参阅 Amazon Neptune 定价页面AWS 区域表