Amazon Bedrock 防护机制宣布推出内容过滤器和被拒绝主题的等级
Amazon Bedrock 防护机制公布了内容过滤器和被拒绝主题的等级,根据客户使用案例提供更灵活、更便捷的功能选择,并扩展对更多语言的支持。有了新的标准等级,防护机制现在能够基于更精准的上下文理解,检测并过滤不良内容,支持拼写错误等修改,并涵盖多达 60 种语言。
Bedrock 防护机制提供可配置的安全保障措施,以帮助检测和阻止有害内容与提示攻击,定义主题以拒绝和禁止特定主题,并帮助编辑个人身份信息(PII),例如来自输入提示和模型响应的个人数据。此外,Bedrock 防护机制可帮助检测和屏蔽模型幻觉,并使用自动推理检查功能来识别、更正和解释模型响应中的事实性声明。防护机制可以应用于任何基础模型,包括由 Amazon Bedrock 托管的模型、自托管模型以及使用 ApplyGuardrail API 的 Bedrock 之外的第三方模型,从而提供一致的用户体验,并帮助实现安全和隐私控制的标准化。
新的标准等级通过提供更强大的提示和响应变体检测能力、强化对所有类别内容过滤器(包括提示攻击)的防御,并扩展语言支持,从而增强了 Bedrock 防护机制中的内容过滤和被拒绝主题保护功能。改进后的提示攻击过滤器能够在后端清晰区分越狱和提示注入,同时防范包括输出篡改在内的其他安全威胁。要访问标准等级的功能,客户必须明确选择使用 Bedrock 防护机制进行跨区域推理。
要了解更多信息,请参阅技术文档和 Bedrock 防护机制产品页面。