亚马逊AWS官方博客

Category: Artificial Intelligence

AWS 一周综述:Amazon EC2 M8azn 实例,Amazon Bedrock 中的新开放权重模型等(2026 年 2 月 16 日)

本周的开篇新闻就是一个很好的例子:Amazon EC2 M8azn 实例正式推出。它们是通用型、高频率、高网络实例,由第五代 AMD EPYC 处理器提供支持,提供云中最高的 CPU 频率,达到 5 GHz。与上一代 M5zn 实例相比,M8azn 实例的计算性能最高提高了 2 倍,内存带宽提高了 4.3 倍,L3 缓存容量则增加了 10 倍。与 M5zn 相比,它们还提供最高 2 倍的网络吞吐量和最高 3 倍的 Amazon Elastic Block Store(Amazon EBS)吞吐量。

Firecracker在航空营销多智能体中的应用

本文聚焦大型航空公司智能营销系统个性化报价的核心需求与痛点,提出基于 Firecracker 的 Agent CodeAct 解决方案。该方案依托 CodeAct 框架让大模型生成可执行代码,搭配轻量级虚拟机 Firecracker 提供安全高效的隔离执行环境。系统整合用户画像、航班动态等数据,遵循库存贬值率、价格敏感度等四大核心原则,通过多智能体协作计算最优报价方案。经多场景测试验证,该方案可平衡航司收益与用户转化率,实现个性化精准营销,且能适配企业自动化运维、金融科技等多类复杂业务场景。

基于AgentCore构建自学习、可进化的文旅行业近似信息抽取Agents

本文以文旅行业的OTA酒店合同报价单处理为场景,介绍了如何基于Bedrock AgentCore 构建一个自学习、可进化的多Agents系统。通过使用ReAct范式和SCOPE机制使Agents具备了从历史处理经验中学习并自主适应变化的能力;利用AgentCore Memory记忆机制解决了经验积累问题;结合AgentCore Runtime实现了多Agents的快速部署与动态编排,降低了开发与维护成本,提升了整体系统的运营效率和经济性。

低延迟实时语音识别(ASR)模型部署实践与选型

本文选取 Whisper Large‑v3 Turbo、Voxtral Mini 与 NVIDIA Parakeet 三个代表性小参数模型,在统一的 NVIDIA GPU + SageMaker Real‑time 端点 技术栈上完成了可复现的部署与基准测试:包括 JumpStart 一键部署、BYOC 自定义镜像、端点调用 payload 示范,以及对不同音频长度和并发条件下的延迟与吞吐进行量化对比。

AWS 一周综述:Kiro CLI 的最新功能、AWS European Sovereign Cloud、EC2 x8i 实例等(2026 年 1 月 19 日)

新年伊始,AWS 社区便活力满满,各类 AWS re:Invent 大会核心内容回顾活动在全球多地陆续开展,部分社区更是已启动 AWS Community Day 活动。就在上周,2026 年特拉维夫 AWS Community Day 活动顺利举办。