亚马逊AWS官方博客
Category: Artificial Intelligence
在 Amazon Bedrock 中结合 RAG 与 MCP 高效缓解提示词膨胀问题
本文详细介绍了在 Amazon Bedrock 中结合 RAG 与 MCP 来解决大语言模型工具选择中的提示词膨胀问题。文章阐述了 RAG-MCP 的架构设计、实现步骤和优化策略,包括工具数据获取、向量化存储和语义检索等核心环节。
Amazon Q Developer CLI + 飞书——打造对话式的 AI Agent 智能运维平台
主要介绍如何通过Amazon Q CLI + Bedrock + MCP + 飞书打造对话式的智能运维平台
AWS 一周综述:Project Rainier、Amazon CloudWatch 调查、AWS MCP 服务器等(2025 年 6 月 30 日)
每次到访西雅图时,在机场首先映入眼帘的总是 Mount Rainier 山峰。您知道吗?AWS 最具创新性的项 […]
利用 Amazon SageMaker Sticky Session 实现大语言模型推理加速
本文探讨了 Amazon SageMaker Sticky Session 技术如何解决大语言模型推理中的性能挑战。通过会话绑定机制,确保同一用户的请求路由至相同计算实例,实现 KV Cache 复用和上下文保持,这一技术显著降低多轮对话延迟,提升用户体验,特别适合交互式 AI 应用场景。
快时尚电商行业智能体设计思路与应用实践(三)借助 Transcribe/Polly 打造新一代智能语音客服,实现媲美人工客服的对话体验
在快时尚电商行业智能化生态系统的演进历程中,随着文本驱动智能体在逻辑推理和任务执行层面的日趋成熟,进一步提升交互体验的关键突破口正转向更加拟人化的语音到语音(S2S)解决方案。这一技术演进的核心目标是根本性改变传统语音交互中机械化应答所带给客户的负面感受,为用户打造更自然、更富有情感共鸣的智能对话体验。
基于 AWS 构建企业 AI 助手:云南神农集团案例分析
在核心系统迁移到 AWS 后,在 AWS SA 的指导下,企业构建了综合性企业 AI 助手系统。通过使用整合大语言模型、企业知识库及业务系统数据 MCP Server,实现了对业务场景的深度理解与实际问题解决能力。
GenDev 智能开发:Amazon Q Developer CLI 赋能 Jenkins 实现智能代码审核
本文介绍 Amazon Q Developer CLI 与 Jenkins 的集成方案,实现自动化 AI 代码审核。内容包含完整实施步骤、配置脚本及示例代码,助力开发者高效应用 AI 工具于开发流程。
得心应手:探索 MCP 与数据库结合的应用场景
MCP+数据库扩展了大模型的数据访问能力,实现数据全流程自动处理,工具调用自我迭代,只需提出业务需求即可得到结果。 相比传统编程数据库访问方式,无需手工编写 SQL 和处理执行结果,极大提高效率。 结合各种 MCP Server,实现多种应用场景。
AWS 一周综述:re:Inforce re:Cap、Valkey GLIDE 2.0、Lambda 上的 Avro、Protobuf 和 MCP Servers 等(2025 年 6 月 23 日)
上周的标志性活动是以安全为重点的 AWS re:Inforce 大会。 作为年度传统,博客团队发布了一篇 re […]
在 Amazon EKS 上使用 DeepSpeed 进行 Llama 2 分布式训练
本篇成功地在 Amazon EKS 上使用 DeepSpeed 框架训练 LLama2 大语言模型,方案结合 Kubeflow 进行任务编排,DeepSpeed 的 ZeRO 优化器有效降低了内存占用, 利用 EFA 网络加速节点间通信,实现高效 GPU 资源调度和低延迟数据传输,为企业级模型训练提供可扩展解决方案。