亚马逊AWS官方博客
边缘协同,云上智能:重构智能汽车数采新架构
随着智能汽车电子电器架构的迭代升级,车端算力水平正经历前所未有的提升。在这一技术背景下,我们持续探索构建更为高 […]
基于 Amazon SageMaker 有状态路由优化大规模推理集群下的 KV Cache 复用方案
本文基于 Amazon SageMaker 的 Stateful Session(有状态会话路由)机制,通过唯一会话 ID 确保同一会话的所有请求路由到同一实例,从而在分布式环境下实现有效的 KV 缓存复用。
Amazon Q Developer 结合 MCP 实现智能化云成本分析
本文详细介绍了如何利用 Amazon Q Developer 结合 Model Context Protocol (MCP) 技术,实现 Amazon 成本和使用报告(CUR)的智能化分析。
云上大规模蛋白结构预测最佳实践
蛋白质的三维结构预测被广泛应用于药物研发。然而,AlphaFold 等工具对 GPU 资源和存储要求极高,实现大规模并发结构预测具有挑战性。为解决这一问题,我们推出了蛋白结构预测工作台解决方案。本文通过实际用户案例展示如何利用该工作台在云上高效执行数百个并发蛋白质结构预测任务,并归纳出构建云端蛋白结构预测平台的最佳实践。
RAG-MCP 性能剖析:在 Amazon Bedrock 中多维度测试提示词优化的效果
RAG-MCP 框架在 Amazon Bedrock 环境中的性能表现。通过多维度测试,对 RAG 在 Tool 调用时产生的价值做了评估。
Amazon Nova Canvas 更新:推出虚拟“试穿”和样式选项
您是否想过在购买之前能快速想象出一套新衣服在您身上的样子? 或者是一件家具在您家客厅里的样子? 今天,我们很高 […]
使用全新的 Amazon DynamoDB 全局表功能,构建高韧性的应用程序
尽管成千上万的客户在成功使用 Amazon DynamoDB 全局表最终一致性功能,但我们发现对于更强的韧性需 […]
基于亚马逊云科技托管 Flink 的开发系列 — MySQL CDC 写入数据湖篇
1. 概述 上文讲述了在亚马逊云科技托管的 Apache Flink 中如何读取基于 SSL 通讯的 Apac […]
在 Amazon Bedrock 中结合 RAG 与 MCP 高效缓解提示词膨胀问题
本文详细介绍了在 Amazon Bedrock 中结合 RAG 与 MCP 来解决大语言模型工具选择中的提示词膨胀问题。文章阐述了 RAG-MCP 的架构设计、实现步骤和优化策略,包括工具数据获取、向量化存储和语义检索等核心环节。
正式推出新 Amazon EC2 C8gn 实例,提供高达 600 Gbps 的网络带宽
现在,我们宣布由 AWS Graviton4 处理器和最新的第六代 AWS Nitro 卡提供支持的 Amaz […]