亚马逊AWS官方博客

Category: Artificial Intelligence

Amazon Bedrock模型推理的Serverless 异步架构 – 处理在线多模态高负载案例

当大模型应用从纯文本扩展到图片、PDF 等多模态输入时,推理耗时长且不可预测、RPM/TPM限流频发成为生产落地的两大瓶颈。本文分享一套基于 Amazon SQS 与 AWS Lambda Serverless 异步架构,在 Amazon Bedrock之上串起缓冲、控速、重试与结果入库的完整管道,经多模型压测验证可稳定支撑高并发多模态负载,适用于内容审核、文档处理、合规审查及多 Agent 协作等场景。

一种基于Web访问的Kiro CLI 共享访问实现

KiroCLI凭借Agentic精确度,先进的模型能力和企业级应用案例等优势,成为了许多企业用户的首选AIOps工具。但企业员工在使用Kiro CLI的过程中,如何实现统一的管理,确保工具的使用安全与合规等,是摆在Ops团队面前的重要问题。同时,Kiro CLI本地运行还存在凭证管理复杂,权限控制复杂,企业网络出站访问配置等繁琐配置。Webaccess KiroCLI Platform提供了一种基于Web终端的TTY共享访问架构,基于Gotty+FastAPI+Vue的技术框架,实现TTY的浏览器转换,采用AWS IAM Identity Center实现SSO零凭证分发,并叠加合规日志,设备指纹,黑白名单等一系列的安全功能,让开发者和运维人员无需本地安装,即可通过浏览器使用完整的Kiro CLI能力。本文将详细介绍在北京/宁夏区部署Webaccess KiroCLI Platform的完整流程,包括环境准备、自动化部署、安全配置和生产优化。

实现工作流程现代化:Amazon WorkSpaces 现已为人工智能代理提供专属桌面(预览版)

今天,我们宣布:Amazon WorkSpaces 现在支持人工智能代理在不进行应用程序现代化改造的情况下安全操作桌面应用程序。数百万员工使用和信赖的托管虚拟桌面如今同样可为人工智能代理提供服务,从而将 WorkSpaces 转变为提升企业生产力的基础设施,而不仅仅是交付产品。由于代理在现有的 WorkSpaces 环境内运行,因此无需开发 API、无需规划应用程序迁移,也无需管理新的基础设施。

从应用到 Agent:开发范式正在发生什么变化?

AI Agent 正在将软件从执行预定义逻辑的应用,转变为基于目标进行动态决策与行动的系统。这一变化为开发者带来更强能力的同时,也引入了新的工程挑战。 本文从开发者视角出发,解析 Agent 与传统应用在执行模型与系统结构上的差异,并结合云原生实践,探讨在生产环境中构建可扩展、可控的 Agent 系统时需要关注的关键问题,包括隔离、状态管理与成本控制。