Amazon Bedrock 的防护机制

实施根据您的应用程序要求和负责任的人工智能政策定制的保障措施

使用防护机制为 Amazon Bedrock 构建负责任的人工智能应用程序

观看演示,了解如何使用基础模型 (FM) 创建和应用定制的防护机制,以便在生成式人工智能应用中实施负责任的人工智能策略。

为您的所有应用程序提供一致的 AI 安全级别

Amazon Bedrock 的防护机制会根据特定使用案例的策略评估用户输入和 FM 响应,无论底层 FM 如何,均提供额外的保障措施。防护机制可以应用于 Amazon Bedrock 上的所有大型语言模型 (LLM),包括经过微调的模型。客户可以创建多个防护机制,每个均配置不同的控件组合,并可以在不同的应用程序和用例中使用这些防护机制。 

用户界面截图

在生成式人工智能应用程序中屏蔽不良话题

组织认识到需要管理生成式人工智能应用程序中的交互,以提供有针对性及安全的用户体验。他们希望进一步自定义交互,继续关注与业务相关的话题,并与公司政策保持一致。Amazon Bedrock 防护机制使用简短的自然语言描述,允许您在应用程序的上下文中定义一组要避免的主题。防护机制可检测并屏蔽属于受限主题的用户输入和 FM 响应。例如,银行助理可以设计成避开与投资建议相关的话题。

Amazon Bedrock 内容筛除条件防护机制

根据您的负责任的 AI 策略筛除有害内容

Amazon Bedrock 防护机制提供带有可配置阈值的内容筛除条件,用于筛除仇恨、侮辱、性、暴力、不当行为(包括犯罪活动)和提示词攻击(即提示词注入和越狱)等有害内容。大多数 FM 已经提供了内置保护措施,以防止产生有害响应。除这些保护措施外,防护机制还允许您配置不同类别的阈值,以筛除掉有害的交互。增加过滤器的强度会增加筛除的严苛度。防护机制会自动评估用户查询和 FM 响应,以检测并帮助阻止属于受限类别的内容。例如,电子商务网站可以设计其在线助手,以避免使用仇恨言论或侮辱等不当语言。

被 Amazon Bedrock 防护机制拒绝的话题

编辑敏感信息 (PII) 以保护隐私

Amazon Bedrock 的防护机制允许您检测用户输入和 FM 响应中的敏感内容,比如个人身份信息 (PII)。您可以从预定义的 PII 列表中进行选择,也可以使用正则表达式 (regex) 定义敏感信息类型。根据使用案例,您可以选择性地拒绝包含敏感信息的输入或编辑 FM 响应中的敏感信息。例如,在呼叫中心根据客户和座席的对话记录生成摘要时,您可以编辑用户的个人信息。

化名和 gdpr 图标