发布于: Nov 28, 2023
今天,我们宣布推出 Amazon Bedrock 的 Guardrails 功能(预览版)。借助这项功能,客户能够根据其应用场景和负责任的人工智能策略在多个基础模型 (FM) 上实施保护措施。客户可以创建针对不同应用场景量身定制的多项防护机制,并将其应用于多个 FM,从而提供一致的用户体验并实现生成式人工智能应用程序安全控制的标准化。
客户需要保护其生成式人工智能应用程序,以便打造相关且安全的用户体验。尽管许多 FM 都使用内置的保护措施来筛选掉不良和有害内容,但客户可能希望针对其应用场景进一步定制互动,并遵守负责任的人工智能策略。例如,银行可能希望对其在线助理进行配置,以便避免提供投资建议,并限制有害内容。借助 Guardrails 功能,客户可以定义一组应用程序中需要被拒绝的话题,并配置阈值来筛选掉仇恨、侮辱、性和暴力等类别的内容。Guardrails 会根据需要被拒绝的主题和内容筛选条件来评估用户查询和 FM 响应,帮助防止出现属于受限类别的内容。这让客户能够根据具体的应用程序要求和策略全面管理用户体验。
Guardrails 功能支持基于文本的 FM 中的英文内容,并且支持 Amazon Bedrock 上的微调模型和 Amazon Bedrock 代理。Amazon Bedrock 的 Guardrails 功能现已在美国东部(弗吉尼亚州北部)和美国西部(俄勒冈州)推出预览版。
要详细了解 Amazon Bedrock 的 Guardrails 功能,请访问功能页面。