亚马逊AWS官方博客

Category: Artificial Intelligence

双壁合一 采用 Amazon DocumentDB 向量和文本搜索构建 RAG 双路召回 集成 Amazon Bedrock Claude 3 实现游戏产品推荐

本博客将展示如何采用 Amazon DocumentDB 和 Amazon Bedrock 构建游戏行业产品推荐,博客中的 Demo 已经接入了目前最新的 Bedrock Claude 3 Sonnet 模型。Anthropic 目前的评估表明,Claude 3 模型系列在数学应用题解决(MATH)和多语言数学(MGSM)基准(目前用于大语言模型的关键基准)方面优于同类模型。另外我们使用了 Amazon Bedrock Titan 模型来生成向量,并使用 DocumentDB 将 Titan 生成的向量存储在 Amazon DocumentDB 数据库中,利用 DocumentDB Vector Search 的相似性向量搜索和 DocumentDB Text Search 全文检索功能实现 RAG 双路召回,并将 RAG 双路召回合并结果,返回给 Amazon Bedrock Claude 3 Sonnet,进行内容总结归并。

在 Amazon SageMaker 上托管 Libcom 图片融合服务

图像融合技术广泛应用于多个行业,如电商营销素材和广告创意等领域。其目标是将前景插入到背景图像中,通过解决外观、几何和语义上的不一致性,实现逼真和谐的合成图像。生成式人工智能技术在为商品生成背景时,常常会对商品整体进行修改,导致出现“货不对版”的问题。为控制这一问题,我们推荐一款卓越的图片融合工具库 Libcom(the library of image composition)。

使用 AWS Trainium 加速芯片进行 Llama 2 继续预训练

本文介绍了如何使用亚马逊云科技的 Trainium 芯片对 Llama 2 大型语言模型进行继续预训练。通过与亚马逊云科技合作,通联数据在自有数据上对 Llama2 进行了预训练,取得了良好效果。本文详细描述了使用 AWS ParallelCluster 集群进行训练的步骤,包括集群准备、模型转换、数据处理、训练脚本修改和任务提交等。同时,提供了训练过程中可能遇到问题的定位方法。

基于大语言模型知识问答应用落地实践 – 使用 TruLens 做自动化 RAG 项目评估测试

我们 【基于大语言模型知识问答应用落地实践】 系列博客前 4 篇已经介绍了知识库构建和召回调优方面的实践经验,随着 RAG 项目的逐渐丰富和成熟,越来越多的工作会深入到各种细节的打磨,例如 Prompt 模板调优,更换更新的模型,各类阈值或者参数的调整等。 本篇将介绍如何用 TruLens 框架,一种简单的,系统化的方法来评估 LLM 应用的衡量性能和质量指标,做自动化 RAG 项目评估测试,以及跟踪每次迭代后指标的改善情况。