亚马逊AWS官方博客

如何基于 Amazon Bedrock 构建电商评论分析(VOC)系统?

(一)方案背景

大模型在电商行业应用趋势

随着电商平台的快速发展,客户反馈(VOC,Voice of Customer)的分析需求日益增加,传统的数据分析方法虽然能够处理结构化数据,但在应对海量的非结构化数据(如客户评论、社交媒体帖子等)时往往力不从心。对于 VOC 分析,过去由人工团队筛选少量评论,逐一阅读评论,并根据主观判断对评论进行理解分析,这种方式不仅效率低下,而且容易受到主观因素的影响,导致对客户真实反馈理解不全面、不准确。生成式人工智能技术在这一背景下被引入,因为它能够自动理解和生成自然语言,不仅能够高效处理海量非结构化文本,还能根据客户反馈生成智能洞察和个性化建议,大大提高了分析效率和洞察深度,为企业提供更精准的决策支持。这种技术突破相较于传统分析方法在洞察能力和处理复杂语言上具有显著优势。

方案价值

独立站

电商独立站(eCommerce Independent Website)是指品牌或商家通过自建的独立电商平台进行产品销售,而非依赖于第三方电商平台(如亚马逊等平台)。这种方式让商家能够完全掌控自己的品牌形象、销售数据、定价策略和用户体验。通过自有网站,商家能够提供定制化的购物体验,积累用户数据,增强品牌忠诚度。

独立站的挑战

  1. 流量获取难:不像第三方平台那样自带流量,独立站需要通过广告、SEO 等方式主动获取流量。
  2. 运营难度大:从技术架构、支付系统到物流、客户服务都需要自己管理。

平台卖家

平台卖家指那些通过大型第三方电商平台(如亚马逊、eBay、淘宝等)进行产品销售的商家。这类卖家依托于电商平台自带的流量、支付系统、物流网络等基础设施,降低了自建网站的成本和复杂度,但也面临着许多平台化的限制。

平台卖家的特点与挑战:

  1. 平台规则限制:平台卖家需要遵守电商平台的各类规则,例如商品定价、退货政策、促销活动的限制等。任何违反规则的行为都可能导致店铺被下架或封禁,影响生意的稳定性。
  2. 竞争激烈:由于平台上商家众多,且部分产品同质化严重,平台卖家往往需要与其他卖家拼价格、拼服务,导致利润空间被压缩。同时,平台本身也会与卖家竞争,推出自营商品或推荐优质卖家,使得小卖家在获取流量上面临更大挑战。
  3. 流量依赖:平台卖家依赖平台提供的自然流量,虽然不需要像独立站那样主动获取,但这也意味着他们的客户数据掌握在平台手中,卖家无法自由积累和利用客户资源,品牌忠诚度的培养较为困难。

服务商

电商服务提供商是指那些为独立站和平台卖家提供技术、运营、营销、物流等解决方案的公司或机构。他们通常为电商业务的不同环节提供支持,例如建站服务、数字营销、仓储物流、客户服务外包等。

电商服务提供商的特点与挑战:

  1. 多元化需求:电商服务提供商面向不同规模、不同业务类型的商家,客户需求多样化。这些需求从网站搭建、用户体验设计到流量获取、支付系统集成,甚至包括国际物流和仓储等,服务商需要提供全面的解决方案。
  2. 行业竞争加剧:随着电商行业的发展,越来越多的服务提供商涌现,导致服务商之间竞争加剧。要想在市场中脱颖而出,电商服务提供商需要不断创新,提供更优质的服务。
  3. 客户关系维护:服务商的成功与客户的成功息息相关。与客户建立长期稳定的合作关系,提供高效、优质的服务,并在客户需要时及时响应,是服务商长期发展的关键。

不同业务形态对 VOC 系统需求

需求内容 平台卖家 独立站 服务商
提升客户体验 通过分析客户的反馈,可以发现用户在购买过程中遇到的问题,如网站导航不顺畅、支付方式不便等。针对这些反馈,独立站公司可以进行相应的优化,提高转化率和客户满意度。 VOC 分析可以帮助服务商识别出客户对未来的需求或未满足的需求,从而开发出更加符合客户业务需求的新功能或服务。
产品改进 通过客户评论了解产品配送、售后服务等环节的问题,及时改进,提升客户体验和满意度 客户评论中常常包含对产品的使用感受和改进建议。通过 VOC 分析,商家可以找到产品的优点和缺点,并据此改进产品设计、功能和质量,从而满足客户需求,提升产品竞争力。
服务优化 分析客户对售前、售后服务的评价,独立站公司可以优化客户服务流程。例如,缩短物流配送时间、改进售后退换货流程等,从而提升客户满意度和复购率。 通过客户反馈,服务商可以了解客户在使用他们的技术、物流、营销等服务时遇到的问题,针对这些反馈优化产品和服务,增强客户满意度。
市场趋势和需求预测 基于客户评论分析,平台卖家可以识别产品的优势和不足,及时调整产品细节、质量,或推出新产品以满足市场需求。 通过对大量客户评论的文本分析,独立站公司可以发现潜在的市场需求和趋势,及时调整产品线和营销策略。 分析客户评论可以帮助电商服务提供商了解自己的市场定位是否符合客户期望,进而调整自己的产品和服务战略,以更好地满足市场需求。
提高品牌忠诚度 听取客户的声音、积极回应客户反馈能够增强客户对品牌的信任感和忠诚度。独立站公司可以通过 VOC 分析识别出忠实客户,针对这些客户进行个性化营销,提高客户的粘性。
精准营销 通过分析客户评论中的关键词和情感倾向,独立站公司可以制定针对不同群体的个性化营销策略,提升广告投放效果和转化率。
竞争对手分析 分析竞争对手的客户评论,了解他们的弱点和客户需求,从而调整自己的定价、推广策略,提高自身在平台上的竞争力。 通过了解竞争对手的客户抱怨和满意点,独立站公司可以发现市场机会,并根据这些信息优化自身产品和服务。 通过分析客户对竞争对手的反馈,电商服务提供商可以找到自己服务中的差距,针对性地改进自身的解决方案,提升市场竞争力。
改进广告策略 通过分析客户反馈中的关键词,平台卖家可以更精准地投放平台内广告,提升广告效果,吸引目标用户点击和购买。

(二)方案介绍

架构总览

关键技术

  • 利用 Amazon Bedrock LLM 模型的能力,对用户评论进行深度数据挖掘,包括标签生成、对评论利用标签进行分类。
  • 利用 Amazon Dynamodb 无服务器 NoSQL数据提供数据持久化及指标存储。
  • 使用 Amazon Lambda 无服务器计算服务结合 Amazon API Gateway 提供 API 能力。

(三)方案实现与效果

您可以尝试此 workshop,以帮助您更好地体验和理解此 VOC 方案的实现和效果。

标签生成

大多数电商公司在内部原本缺乏一套明确的产品评论分析标签体系,导致无法高效地从海量评论数据中提取有价值的见解。传统的做法是由人工理解或是简单的情感分析,这种方式并不能深入挖掘评论中海量的真实客户声音。为了使用 LLM 从客户评论数据中更深入地挖掘信息,首先需要构建一套更全面的评论分析的标签体系。因此,我们可以借助 LLM 的能力针对想要分析的“方面”构建详细的标签,用于后续的评论分析中。例如,想要关注产品的“优点”、“缺点”、“购买动机”和“期望”,我们可以抽取一定占比的评论,对每一条评论生成关于““优点”、“缺点”、“购买动机”和“期望”的标签。

标签意思聚合

针对生成的标签,我们发现会存在“意思相同但表达词组不同”的标签,例如“质量好”和“质量不错”“意思相同但表达词组不同”的标签。是两个这类标签会在 BI 呈现时作为多个标签进行分析,影响对产品评论分析的结果。因此,我们需要进一步对标签计数,并对标签占比降序排列,保留累计占比前 95%(建议值)的标签。再次利用 Bedrock 中大模型,对保留的标签进行意思聚合,并存在 DynamoDB 中。

此时,我们获得没有“意思相同但表达词组不同”的一套标签体系,用于后续的评论分析。

评论分析

使用已构建的标签体系,对全量的文本评论数据利用 Bedrock 中的 LLM 进行分析。例如,对每条进行评论分析,对“优点”、“缺点”、“购买动机”和“期望”四个方面使用已有标签体系中的标签,进行打标签。将每条评论的标签结果存到 DynamoDB 中。

报表计算

利用 Bedrock 大模型完成每条评论的标签分类后,我们可使用 Amazon Lambda 无服务器计算服务,计算 BI 报表所需要的参数,并返回给前端。

AI bot 实现

使用 RAG(Retrieval-Augmented Generation)构建聊天机器人是一种创新的方法,在电商评论分析中同样有效,能够有效地处理和分析大量的客户评论数据。将电商评论数据上传并存储在向量数据库(如 Amazon Opensearch、Zilliz Milvus 等)中,使用自然语言进行提问,模型结合从向量数据中实时检索信息并生成精确的回答。在电商评论分析中,构建基于检索增强生成(RAG)技术的聊天机器人可以显著提升用户交互体验和数据分析效率。

(四)生成优化建议

1)利用 Bedrock Batch API 处理大规模标签生成

在 VOC 场景下,企业需要周期对海量评论数据需要进行分析,对评论分析任务是每个月、每个季度、每年进行一次。往往不需要极高的实时性,只需在尽快小时级别获得分析结果。除此之外,对分析成本期望更具成本效益。利用 Amazon Bedrock 的 Batch API 可以有效地处理大规模电商评论数据,保证评论分析的效率和准确性,是更具成本优势的选择。请参阅此处的模型列表。

  • 成本效益:使用批量推理能够以标准按需模式成本的 50% 进行处理,显著降低了大规模数据分析的成本。
  • 高效处理:支持异步处理多个推理请求,允许在 24 小时内完成大规模作业。这种方式适合像 VOC 分钟这类不需要实时响应的任务。

2) 利用向量数据库的检索推荐,自动生成标签

VOC 场景下,利用向量数据库(如 Amazon Opensearch、Zilliz Milvus 等)来进行检索和推荐,并自动生成标签是一种非常高效的方式,特别是在处理大量的客户评论和反馈时。当用户希望分析特定类型的反馈(例如,关于产品质量的评论)时,输入一个查询或参考文本。向量数据库根据该查询向量,在评论数据库中找到语义上最相似的评论。这个过程可以帮助商家迅速定位客户关心的共同问题,获取参考的已生成标签,从而节约对大模型 API 调用的 Token ,提升效率。

  • 大规模处理:向量数据库结合聚类和自动标签生成,能够处理数十万甚至数百万条评论,显著提升 VOC 分析的效率。
  • 精准推荐:通过相似性检索,商家可以快速定位特定类型的反馈,优化产品或服务。
  • 全自动化流程:减少了流程分析的时间成本,能够快速、准确地搜索标签,便于商家针对客户需求作出调整。

3) 利用 Claude JSON model 提升格式化输出

在处理客户评论和反馈时,通常需要提取关键信息(如情感、实体、问题等)并将其转化为标准化的结构数据。Claude 提供格式化输出插件允许大模型以 JSON 的方式响应,从而确保提取的信息在结构上是标准化的。这可以让数据更易于集成到后续分析或系统中,如数据库存储或报表生成。

  • 确保数据一致性和完整性:大模型每次都会以统一的格式返回响应,降低了因输出不一致而导致的错误和不准确。这对企业在大规模客户评论分析中非常关键,有助于保持所有分析结果的高质量和可操作性。
  • 增强分析的可扩展性:通过格式化输出插件,生成的 JSON 数据可以直接用于后续的机器学习分析、数据可视化、BI 工具等场景。对于电商独立站或平台卖家来说,能够快速将客户反馈转化为结构化数据,使得分析可以扩展到更复杂的场景和数据集。

*前述特定亚马逊云科技生成式人工智能相关的服务仅在亚马逊云科技海外区域可用,亚马逊云科技中国仅为帮助您了解行业前沿技术和发展海外业务选择推介该服务。

本篇作者

张鑫

亚马逊云科技解决方案架构师,负责基于亚马逊云平台的解决方案咨询和架构设计,在软件系统架构、数仓和实时及离线计算领域有丰富的研发和架构经验。致力于结合数据开源软件与亚马逊云平台云原生服务组件构建高可用数据架构的实践探索。

张司雨

亚马逊云科技解决方案架构师,负责亚马逊云科技云计算方案咨询和设计。同时致力于数据库和大数据方面的研究和推广,在电商行业各种场景解决方案有丰富的经验。