亚马逊AWS官方博客
Category: Artificial Intelligence
利用大语言模型与 RAG 架构构建智能化 Support Case 问答系统
1. 引言 在云计算环境中,快速响应和解决客户问题至关重要。亚马逊云科技技术支持案例是客户与亚马逊云科技支持团 […]
AWS 一周综述:Amazon Bedrock API 密钥、Amazon Nova Canvas 虚拟试用等(2025 年 7 月 7 日)
每周,我们都会向您介绍上周最受关注的新闻稿和博客。 在继续本周的 AWS 一周综述之前,我想分享一个消息,上个 […]
基于 Amazon SageMaker 有状态路由优化大规模推理集群下的 KV Cache 复用方案
本文基于 Amazon SageMaker 的 Stateful Session(有状态会话路由)机制,通过唯一会话 ID 确保同一会话的所有请求路由到同一实例,从而在分布式环境下实现有效的 KV 缓存复用。
Amazon Q Developer 结合 MCP 实现智能化云成本分析
本文详细介绍了如何利用 Amazon Q Developer 结合 Model Context Protocol (MCP) 技术,实现 Amazon 成本和使用报告(CUR)的智能化分析。
RAG-MCP 性能剖析:在 Amazon Bedrock 中多维度测试提示词优化的效果
RAG-MCP 框架在 Amazon Bedrock 环境中的性能表现。通过多维度测试,对 RAG 在 Tool 调用时产生的价值做了评估。
Amazon Nova Canvas 更新:推出虚拟“试穿”和样式选项
您是否想过在购买之前能快速想象出一套新衣服在您身上的样子? 或者是一件家具在您家客厅里的样子? 今天,我们很高 […]
在 Amazon Bedrock 中结合 RAG 与 MCP 高效缓解提示词膨胀问题
本文详细介绍了在 Amazon Bedrock 中结合 RAG 与 MCP 来解决大语言模型工具选择中的提示词膨胀问题。文章阐述了 RAG-MCP 的架构设计、实现步骤和优化策略,包括工具数据获取、向量化存储和语义检索等核心环节。
Amazon Q Developer CLI + 飞书——打造对话式的 AI Agent 智能运维平台
主要介绍如何通过Amazon Q CLI + Bedrock + MCP + 飞书打造对话式的智能运维平台
AWS 一周综述:Project Rainier、Amazon CloudWatch 调查、AWS MCP 服务器等(2025 年 6 月 30 日)
每次到访西雅图时,在机场首先映入眼帘的总是 Mount Rainier 山峰。您知道吗?AWS 最具创新性的项 […]
利用 Amazon SageMaker Sticky Session 实现大语言模型推理加速
本文探讨了 Amazon SageMaker Sticky Session 技术如何解决大语言模型推理中的性能挑战。通过会话绑定机制,确保同一用户的请求路由至相同计算实例,实现 KV Cache 复用和上下文保持,这一技术显著降低多轮对话延迟,提升用户体验,特别适合交互式 AI 应用场景。


