通过对客户数据进行高级分析,实现客户流失预测
本指南将通过机器学习(ML)帮助您利用结构化数据和非结构化数据构建流失预测模型。客户流失用于衡量停止使用您某种产品或服务的客户的数量。通过使用流失预测模型,您可以采取预防措施,识别可指明一组客户的流失概率的行为和模式。本指南可以帮助那些利用客户反馈和关系来更好地了解客户满意度的企业对企业(B2B)组织。
请注意:[免责声明]
架构图

[文本]
第 1 步
基于 Amazon SageMaker 运行的大型语言模型(LLM)可以提取情绪数据并识别实体和主题,以便处理来自案例管理、电子商务和文件系统的非结构化数据。
第 2 步
AWS Glue 作业将已从电子商务、客户关系管理(CRM)、企业资源规划(ERP)和主数据管理(MDM)系统中提取的结构化客户数据,以及 LLM 获得的非结构化数据见解,整合到单个 Amazon Simple Storage Service(Amazon S3)存储桶中。
第 3 步
SageMaker 管道对经过整合的数据进行预处理,并使用 AutoML 作业根据指定指标训练流失模型。AutoML 作业会尝试几种机器学习模型(例如神经网络或决策树)并调整其超参数,以获得适合您的数据和使用案例的最佳模型。
第 4 步
在 SageMaker 模型注册表中创建和注册流失模型,以管理版本控制和部署。
第 5 步
AWS Lambda 函数使用 Amazon EventBridge 按计划调用 SageMaker 批量推理作业,以估算一批客户的流失概率。推理结果存储在 S3 存储桶中。
第 6 步
Amazon SageMaker Clarify 帮助您更好地了解流式检测背后的模型推理。它会生成一份报告,确定模型中影响流失分数的重要特征,并将其存储在 Amazon S3 中。
第 7 步
Lambda 函数生成流失结果摘要,Amazon Simple Notification Service(SNS)通过电子邮件将摘要发送给决策者。
第 8 步
您可以通过 Amazon Athena 和 AWS Glue 查询和分析 S3 中存储的流失结果。此外,您可以使用 Amazon QuickSight 可视化流失结果并对其进一步分析。
Well-Architected 支柱

当您在云中构建系统时,AWS Well-Architected Framework 可以帮助您了解所做决策的利弊。框架的六大支柱使您能够学习设计和操作可靠、安全、高效、经济高效且可持续的系统的架构最佳实践。使用 AWS 管理控制台中免费提供的 AWS Well-Architected Tool,您可以通过回答每个支柱的一组问题,根据这些最佳实践来检查您的工作负载。
上面的架构图是按照 Well-Architected 最佳实践创建的解决方案示例。要做到完全的良好架构,您应该遵循尽可能多的 Well-Architected 最佳实践。
-
卓越运营
本指南会整合文本数据以丰富数据集,用于创建 SageMaker 模型以预测客户流失风险。Amazon S3 以 CSV 文件的形式存储流失结果,而 Athena 无需额外的运营开销即可查询结果。Amazon SNS 向决策者发送自动分析报告,以便他们能够快速采取行动并降低客户流失的可能性。
-
安全性
AWS Identity and Access Management(IAM)通过基于角色的精细权限控制对数据、机器学习模型和流失见解的访问。此外,SageMaker 只能通过 Amazon Virtual Private Cloud(Amazon VPC)端点访问数据。这意味着数据不会通过公共互联网传输,从而限制了潜在的数据暴露点。
-
可靠性
SageMaker 使用分布式训练库来缩短训练时间并优化模型扩展。SageMaker 还跨多个可用区启动批量转换任务,以降低训练期间发生失败的风险。如果一个可用区失败,则可以在另一个可用区继续训练。此外,Athena、QuickSight 和 AWS Glue 都是无服务器服务,可以轻松扩展数据查询和可视化,而不必担心预置额外的基础设施。
-
性能效率
SageMaker 批量推理允许您处理批量数据,因此您可以一次对一组客户运行流失分析,而不必始终启动并运行一个端点。为支持应对批量推理工作负载的激增,Lambda 提供可根据需求自动扩展的无服务器计算。
-
成本优化
为帮助降低成本,AWS Glue 作业用于对一批用户数据(而不是单个记录)进行提取、转换、加载(ETL)。此外,Lambda 可处理事件以启动批量转换分析,以便您仅在需要时启动计算容量,而不是让服务器一直处于运行状态。组合使用 AWS Glue、Athena 和 QuickSight,将流失见解视作最具成本效益的方式来读取 Amazon S3 中存储的批量数据。
-
可持续性
通过广泛使用无服务器服务(例如 Lambda、AWS Glue、Athena 和 QuickSight),您可以最大限度地提高总体资源利用率,因为计算仅在需要时使用。这些无服务器服务可以扩展以满足需求,从而减少运行工作负载所需的总体能源。您还可以使用 AWS Billing Conductor 碳足迹工具来计算和跟踪工作负载在一段时间内对账户、区域和服务级别的环境影响。
实施资源

提供了在 AWS 账户中进行实验和使用的详细指南。构建指南的每个阶段(包括部署、使用和清理)都将被检查,以便为部署做好准备。
示例代码为起点。它经过行业验证,是规范性但不是决定性的,可以帮助您开始。
免责声明
示例代码;软件库;命令行工具;概念验证;模板;或其他相关技术(包括由我方人员提供的任何前述项)作为 AWS 内容按照《AWS 客户协议》或您与 AWS 之间的相关书面协议(以适用者为准)向您提供。您不应将这些 AWS 内容用在您的生产账户中,或用于生产或其他关键数据。您负责根据特定质量控制规程和标准测试、保护和优化 AWS 内容,例如示例代码,以使其适合生产级应用。部署 AWS 内容可能会因创建或使用 AWS 可收费资源(例如,运行 Amazon EC2 实例或使用 Amazon S3 存储)而产生 AWS 费用。
本指南中提及第三方服务或组织并不意味着 Amazon 或 AWS 与第三方之间存在认可、赞助或从属关系。AWS 的指导是一个技术起点,您可以在部署架构时自定义与第三方服务的集成。