亚马逊AWS官方博客
AWS 一周综述:AWS FinOps 代理预览版、Bedrock 上的 Gemma 4、Kiro Pro Max 等(2026 年 6 月 15 日)
本周,纽约市将举办 AWS Summit。届时,构建者、客户和 AWS 技术团队将齐聚贾维茨会展中心,进行一整天的新品发布、现场演示和技术会议。我为本次峰会发布的部分新功能撰写了博客,很高兴看到这些功能在本周上线。可惜我无法亲临现场。我将参加为期四天的音乐节,一边努力弄清楚如何搭帐篷,一边在手机上关注发布会。如果您也和我一样,无法到场,6 月 17 日将开放主题演讲直播,由代理式人工智能副总裁 Swami Sivasubramanian 博士、安全服务与可观测性副总裁 Chet Kapoor 主讲,覆盖开发工具、AI 基础设施、安全领域的新功能。

以下是本周的核心看点。
头条新闻
前沿团队如何重塑原生 AI 原生开发模式:Swami 本周发表了一篇详细的文章,基于 Amazon 数百支工程团队的实验数据总结实践经验。如果您正在考虑如何在自己的团队中组织人工智能的采用,这些调查发现值得仔细阅读。
一支 6 人研发团队耗时 76 天重构了 Amazon Bedrock 推理引擎;该项目原计划调配 30 名开发人员,周期 12 至 18 个月。Amazon 商店团队多个结构化试点的标准化部署速度中位数提升了 4.5 倍,部分团队的工作效率提升了 10 倍以上。订单优化体验的功能周期从两周缩短至一个下午即可交付。全球生鲜业务的设计文档编写工作从 5 天压缩至几个小时。
文章将这些结果提炼成了打造前沿团队的五大实践。首先,投资于代理上下文:在编写生产代码前,构建引导文件、编码规范与标准化存储库;其次,预期重构工作流程初期进度会放缓,坚持完成流程改造;第三,保持范围清晰的任务积压清单,使代理能够并行执行任务,无需人工持续监督;第四,在代码生成前,通过结构化规范明确意图;第五,测试左移,使代理能够在代码进入管道前自我更正。
该文章最后指出,提交速度只是衡量维度之一,后续内容将涵盖版本管理、运维、安全运维和 EOL 升级。
AWS FinOps 代理现已提供预览版:AWS FinOps 代理是一款面向 FinOps 从业人员和工程团队的新代理,可回答成本问题、揭示优化机会、调查成本异常,以及按照规定的时间表定期运行 FinOps 工作流程。您可以使用该服务来查询 AWS 成本,为财务和工程团队生成成本报告,并显示 AWS 成本优化中心和 AWS Compute Optimizer 提供的规格调整、闲置资源和节省计划建议。该代理可以根据这些建议代表您打开 Jira 工单。当检测到成本异常时,FinOps 代理可以自动调查根本原因并将调查发现发布到 Slack 频道。
上周发布的内容
我先介绍我本周撰写的一篇文章,再梳理其他值得关注的发布内容:
- Amazon EC2 M9g 和 M9gd 实例正式发布:由 AWS Graviton5 处理器提供支持,基于第六代 AWS Nitro System 的 M9g 实例相较于基于 Graviton4 的实例,计算实例提升高达 25%,Web 应用程序性能提升高达 35%、机器学习推理速度提升高达 35%、数据库性能提升高达 30%。Graviton5 是 AWS 实例集中首款支持 PCIe Gen6 和 DDR5-8800 内存的处理器,其三级缓存容量是上一代的 5 倍。与 M8g 相比,M9g 和 M9gd 实例全规格的网络带宽平均最高提升 15%,Amazon EBS 带宽平均最高提升 20%。此版本还引入了 Nitro 隔离引擎,这是 Nitro 虚拟化系统的增强组件。该引擎采用形式化验证技术,从数学层面严格保障虚拟机之间的隔离性,也让 Nitro 成为全球首款通过形式化验证的云虚拟机监控程序。与 M8gd 相比,M9gd 实例新增最高 11.4TB 的 NVMe SSD 本地固态存储,其 IOPS 性能提升了 30%。两种实例类型均支持实例带宽配置(IBC),可在 EBS 存储和 VPC 网络之间调整带宽分配,调整幅度最高可达 25%。
- Amazon Bedrock 上的 Anthropic Claude Fable 5:Claude Fable 5 于 6 月 9 日在 Amazon Bedrock 上线,该模型具备超长异步任务执行能力、可解析图表和 PDF 的高阶多模态视觉能力,以及主动自我验证功能。调用该模型前,您必须通过数据留存 API 开启数据共享权限;针对神话级(Mythos-class)模型,Anthropic 要求平台将输入和输出保留 30 天。关于可用性的重要说明:6 月 12 日,Anthropic 要求 AWS 撤销所有用户对 Claude Fable 5 和 Claude Mythos 5 的访问权限,以支持遵守美国政府的出口管制指令。所有其他模型(包括 Opus 4.8)不受影响。详情请阅读 Anthropic 声明。AWS 将在更新发布后同步分享。
- Gemma 4 模型现已在 Amazon Bedrock 上线:Google DeepMind 推出的 Gemma 4 系列现已在 Amazon Bedrock 上线共提供三种版本:Gemma 4 31B(稠密架构,256K 上下文窗口,适用于推理、编码工作负载);Gemma 4 26B-A4B(混合专家 MoE 架构,面向对成本和延迟敏感的工作负载);以及 Gemma 4 E2B(最小版本,专为低延迟交互式使用案例设计)。这三款模型都支持原生函数调用、结构化输出、推理、响应流、跨文本、图像、视频和音频的多模态输入以及超过 35 种语言。
- Amazon OpenSearch Service 推出 MCP 应用以实现代理可观测性:Amazon OpenSearch Service 现在支持 MCP 应用,在包括 Claude Desktop 和 VS Code 在内的兼容代理 IDE 中启用可观测性工作流程。本地环境中的人工智能代理可以使用存储在 OpenSearch 域、集合和 Amazon Managed Service for Prometheus 中的日志、跟踪、指标和警报来调查事件。每次调用 MCP 应用工具会返回双重响应:一段供代理分析推理的文本摘要,以及可在当前对话窗口直接呈现的交互式可视化内容。可用的 MCP 应用程序工具涵盖日志、指标和跟踪调查、服务性能、拓扑、动态可视化、代理运行状况、集群运行状况和埋点评分。
其他 AWS 新闻
以下是一些其他可能对您有用的文章和更新:
- AWS CLI v1 进入维护模式:CLI v1 进入维护模式后,botocore 和 s3transfer 依赖项会直接内置打包进 CLI v1 代码库,不再作为单独的软件包安装。这意味着升级 CLI v1 不会再更新独立的 botocore 或 s3transfer 包。单独安装这两个包也不会对 CLI v1 使用的版本产生任何影响。同时安装了 CLI v1 和 boto3 的环境会各自拥有这些库的独立副本。新的 CLI v1 版本仅限于关键错误修复和安全问题。推荐迁移至 AWS CLI v2。
- AWS 工作负载凭证提供程序现已可用:AWS 推出新的工作负载凭证提供程序,各类业务负载无需配置长期访问密钥即可获取短期 AWS 访问密钥。该功能可对在 AWS 之外运行的应用程序进行凭证管理,使团队能够遵循第三方或本地环境中的工作负载的最低权限访问模式。
- Kiro Pro Max 现已可用:Kiro 推出全新 Pro Max 层级,为开发团队提供更高的使用限额、最新前沿模型的访问权限以及多项代理功能。Kiro Pro Max 专为需要在编码、规范生成和代理驱动型任务中持续、大批量使用模型的专业开发人员而设计。
即将举行的 AWS 活动
查看您的行程并报名参加即将举行的 AWS 活动:
- AWS Summit:AWS Summit 是涵盖云和人工智能的免费线下活动。即将在以下地点举行:纽约市(6 月 17 日)、香港(6 月 17 日)、上海(6 月 23 日至 24 日)、日本(6 月 25 日)、华盛顿特区 (6 月 30 日至 7 月 1 日)、台北(7 月 15 日)和波哥大(7 月 30 日)。
- AWS Community Day:由社区领导者策划和举办的社区主导的会议。即将举行活动的地点包括加拿大蒙特利尔(6 月 20 日)、美国印第安纳波利斯(6 月 24 日)、中国杭州(6 月 28 日)、印度班加罗尔(7 月 11 日)和喀麦隆雅温得(7 月 25 日)。
访问 AWS Builder Center 与其他构建者会面,贡献解决方案,并查找可帮助您继续构建的资源。您还可以浏览即将举行的 AWS 主导的线下和线上活动,以及以开发人员为中心的会议。
本文是我们“一周综述”系列中的一篇。请关注每周的“一周综述”文章,快速总览来自 AWS 的重要新闻和公告!