亚马逊AWS官方博客

用 LiteLLM WebSearch Interception 集成 AWS 托管的 Amazon Bedrock AgentCore Web Search 能力

在不修改客户端、不 fork LiteLLM 源码的前提下，将 LiteLLM 的 websearch interception 搜索后端从自建 SearXNG 替换为 Amazon Bedrock AgentCore Web Search——一项 AWS 全托管、由 Amazon 自营 web 索引在 AWS 基础设施内服务搜索查询（查询不发往第三方搜索引擎）的 Web 搜索服务。文末给出进阶用法：将其暴露为 MCP server，使没有 AWS 凭证的客户端（如 OpenAI Codex）也能通过一个 LiteLLM virtual key 进行调用。

AI 时代的 EKS 升级范式：用 Kiro-cli 让 Agent 接管识别、升级与排障

本文以真实集群从 EKS 1.32 升级到 1.35 为例，展示如何将风险识别、路径规划、升级执行和故障定位交给 Kiro agent。我们在同一集群做对照实验——唯一变量是否加载 Skill 知识库：无 Skill 时工程师需全程介入，耗时约 6 小时；加载 Skill 后 agent 自主执行，耗时约 2.5 小时，节省 60%。两组共享同一工具链，差距主要来自 Skill。更值得关注的是，agent 在实战中主动发现新隐性约束并补充回 Skill，说明知识库具备随实战增长的潜力。

Graviton 优化 Agentic RL 沙箱层：架构与成本优势分析

讨论 Agentic RL 训练成本时，基于 Graviton5 的 m9g 实例，可将沙盒层成本降低多达 43%。该分析同样适用于 Agent 执行工具调用和代码的 CPU 沙盒环境。

AWS 正式发布 Lambda MicroVMs：面向 AI 时代的无服务器安全代码执行环境

本文介绍了Lambda MicroVMs 是 AWS Lambda 中一种全新的无服务器计算原语：为每个用户或会话提供一台专属的、有状态的、虚拟机级隔离的轻量执行环境——启动近乎瞬时，空闲自动挂起，完全无需管理基础设施。

Lambda MicroVMs vs Lambda Functions：全方位深度对比

本文从隔离级别、状态保持、启动模型、网络模型、计费对比等多个维度深入对比 Lambda MicroVMs 和 Lambda Functions，帮助架构师做出正确的技术选型。

Lambda MicroVMs vs Bedrock AgentCore：AI Agent 开发者该怎么选？

2026 年 6 月，AWS 同时拥有了两个能”安全运行 AI 生成代码”的 Serverless 产品——Lambda MicroVMs 和 Bedrock AgentCore Runtime。它们底层都基于 Firecracker microVM，却处在完全不同的抽象层。本文从定位、架构、计费、适用场景等维度做深度对比，帮助 AI Agent 开发者和架构师做出正确选择。

Amazon VPC Regional NAT Gateway 与 AZ NAT Gateway 全面对比

本文系统对比了 AWS NAT 网关的两种可用性模式：传统的 AZ（可用区）NAT 网关与 2025 年新发布的 Regional（区域）NAT 网关。从架构原理、高可用性、运维复杂度、规格上限、计费模型等维度逐一分析，帮助读者根据实际场景选择最合适的 NAT 网关模式。

Amazon Quick 飞书SSO对接指南

摘要：Amazon Quick 是 AWS 推出的 AI 工作助手，能够将问题转化为答案、将答案转化为行动。它 […]

使用 AWS CloudFormation 快速模式将基础设施部署速度提升多达 4 倍

今天，我们宣布推出 AWS CloudFormation 快速模式，这是一种新的部署模式，可以为反复调试基础设施的开发人员和人工智能工具加快部署速度。在快速模式下，CloudFormation 只要确认资源配置已完成下发，部署任务即可结束，无需等待漫长的稳定性检查。对于迭代开发工作流程和生产场景，部署时间最多可缩短至原来的四分之一。

采用 AWS Graviton5 处理器的 Amazon EC2 C9g 和 C9gd 实例现已推出

今天我很高兴地宣布，由 AWS Graviton5 处理器提供支持的 Amazon Elastic Compute Cloud（Amazon EC2）C9g、C9gd 实例现已正式发布。C9g 为计算优化型实例，与上一代 C8g 实例相比，单 vCPU 性能提升高达 25%。该实例搭载云端处理器实例中的快速内存模组 DDR5 8800MT/s DIMM，与 Graviton4 处理器相比，三级缓存容量提升 5 倍，数据包处理性能最高可提高 3 倍。更快的内存和更大缓存容量意味着可大幅减少工作负载的数据等待耗时，从而提升内存中分析的吞吐量、加快代理循环执行速度，同时提高实时应用程序的响应速度。

亚马逊AWS官方博客

了解

资源

开发人员

帮助