亚马逊AWS官方博客
Amazon Nova Act 现已全面推出,助力构建可靠的人工智能代理,实现用户界面工作流程自动化
今年早些时候,我们发布了 Nova Act 的研究预览版,展示了人工智能代理与用户界面交互和自动化复杂工作流程的潜力。开发人员们对 Nova Act 进行了实验,并告诉我们他们希望将这些自动化代理投入生产环境。
但是,要将代理投入生产,仅靠模型访问权限是远远不够的。开发人员需要耗费大量时间编排工作流程、优化提示词、挑选合适工具,并将分散的组件整合起来以实现可靠的自动化。挑战不仅在于智能,更在于可靠性、集成性以及投产速度。因此,我们打造了一套完全集成的解决方案,专为生产就绪的浏览器自动化而设计。
今天我们宣布 Amazon Nova Act 正式发布,这是一项全新的 Amazon Web Services(AWS)服务,旨在帮助开发人员构建、部署和管理可靠的人工智能代理集群,实现生产环境用户界面工作流程的自动化。Nova Act 在规模化应用中实现了超过 90% 的任务可靠性,相较于其他人工智能框架,它提供了最快的价值实现时间和最简便的实施流程。
以下是 Nova Act 控制台的快速概览。

Nova Act 致力于解决在企业级规模构建可靠浏览器自动化所面临的挑战。Nova Act 搭载定制版 Amazon Nova 2 Lite 模型,擅长驱动浏览器操作、支持 API 调用,并能在必要时无缝转接人工服务。该服务具备网页质量保证(QA)测试、数据录入、数据提取及结算流程等核心功能。
当前大多数模型都是孤立训练的,与执行任务的编排工具和执行器相分离,这降低了可靠性。Nova Act 采用了一种独特方法,它通过强化学习技术,让代理在模拟真实用户界面的定制合成环境(“网络训练场”)中运行学习。这种涵盖模型、编排工具、工具和 SDK 的垂直整合体系,通过协同训练实现了规模化应用下的更高任务完成率。其成果就是构建出一个代理式系统,不仅能偶尔运作,更能大规模稳定运行,拥有应对变化的推理能力和适应能力。

开始使用 Nova Act
Nova Act 提供一体化开发人员体验,助您在数小时内从原型阶段直达生产环境。让我为您详细道来这段旅程。
从操场开始
首先,我们访问 nova.amazon.com/act 进入 Nova Act 操场。在这里,我们可以快速体验并直观感受 Nova Act 的实际运作。

在这些测试中,我们使用 Nova Act Gym,这是一款专为测试 Nova Act 代理而设计的模拟浏览器环境。我们正在使用一个探索地球系外行星的虚构旅行预订网站。

在这里,我们可以使用自然语言命令快速对工作流程进行原型设计,无需编写任何代码。我们输入需要自动化的 URL,并描述 Nova Act 需执行的操作。我们可以通过选择添加操作来增加更多操作。

定义操作后,我们在实时浏览器会话中运行 Nova Act 代理。如此一来,我们便能验证自动化方案是否如预期般运作。

验证工作流程后,我们可以将其导出,以便在集成式开发环境(IDE)(如 Visual Studio Code(VS Code)、Kiro 和 Cursor)中继续开发。

在 IDE 中优化
在此阶段,我们需要在支持的 IDE 中对自动化流程进行优化完善。我们使用 Kiro 并安装 Nova Act 扩展插件。

该扩展提供了一种笔记本风格的生成器模式,使我们能够单独测试和调试每个步骤。实时浏览器视图精确展示代理的操作过程,而执行日志则显示模型的推理逻辑与行动轨迹。这使得优化工作流程和处理边缘情况变得简单明了。

要了解如何在 IDE 中使用 Nova Act 扩展,请访问 AWS 新闻博客中的 Accelerate AI agent development with the Nova Act IDE extension。Nova Act 扩展包含多种模板,助您快速上手常见工作流程模式。

在此版本中,Nova Act IDE 扩展新增了身份验证、生成器模式、部署和运行工作流程专属选项卡,将完整的开发生命周期融入 IDE。虽然该扩展提供了最便捷的生产部署途径,但开发人员也可以直接使用 Nova Act 命令行界面(CLI)或 SDK 实现更高级的部署配置。

部署至 AWS
当工作流程准备就绪可投入生产时,我们前往部署选项卡,直接部署至 AWS。我们输入工作流程定义名称(必须与脚本中的名称一致),选择 AWS 区域,也可自行决定是否提供一个现有的 AWS Identity and Access Management(IAM)角色 Amazon 资源名称(ARN)。该扩展将工作流程打包至 Docker 容器,将其推送到Amazon Elastic Container Registry(Amazon ECR),创建必要的 IAM 角色和 Amazon Simple Storage Service(Amazon S3)存储桶,并将其部署到 Amazon Bedrock AgentCore 运行时上。

部署完成后,我们可以通过 Nova Act 控制台监控工作流程的执行情况。我们导航到工作流程定义。控制台提供可观测性仪表板,当工作流程需要人工输入时,我们可以配置带有通知功能的自定义仪表板,以便主管及时介入。

然后,为工作流程选择定义,我们向下滚动以查找工作流程运行记录。

在此处,我们可以看到有关工作流程运行的更多信息。

在此处,我们可以跟踪工作流程进度和执行日志。每一步都展示了代理的推理过程、操作行为及浏览器截图,这与我们在 IDE 中开发时的可视化程度完全一致,现在这种监控能力已扩展至规模化生产执行场景。

这种从实验到生产的直接过渡,消除了通常需要花费数周时间整合不同工具和编排逻辑的过程。
结合使用效果更好:Nova Act 和 Strands Agents
随着代理系统的成熟,对专业代理间无缝协作的需求变得至关重要。Nova Act 与 Strands Agents 框架天然集成,无需定制化集成工作即可构建全面的多代理工作流程。Strands 为协调跨域代理系统提供编排层,而 Nova Act 则为浏览器前端用户界面自动化提供专业级可靠性保障。这种开箱即用的兼容性体现了现代代理架构应有的工作方式,即通过集成专用组件来解决复杂的业务问题。
开发人员可以使用 Strands 来协调复杂的工作流程,Nova Act 作为专业工具处理各种浏览器自动化组件,并将这些组件与其他代理无缝集成。团队可利用此架构,在由 Strands 编排的更广泛代理生态系统中,充分发挥 Nova Act 专为用户界面自动化设计的强大功能。
注意事项
以下是需要注意的要点:
- 集成:与 Strands 代理框架配合使用,用于构建跨域的复杂多代理工作流程。
- 定价:访问 Amazon Nova Act 定价页面了解详细信息。
- Nova Act 和负责任的人工智能:Nova Act 内置安全管控与内容审核功能,整合了推理能力提升、自主代理安全性强化及对抗攻击鲁棒性等前沿技术,旨在推动负责任的人工智能应用。
- 可用性:Amazon Nova Act 现已在美国东部(弗吉尼亚州北部)AWS 区域推出。要了解最新的区域可用性,请访问按区域列出的 AWS 功能页面。
开始使用 Nova Act,请访问 nova.amazon.com/act 获取您的 API 密钥并探索操场。