Amazon Bedrock 防護機制宣佈推出適用於內容篩選條件和拒絕主題的方案
Amazon Bedrock 防護機制宣佈推出適用於內容篩選條件和拒絕主題的方案,為選擇功能提供額外的彈性和易用性,以及根據客戶使用案例擴展的語言支援。有了新的標準方案,防護機制現在可以透過更好的內容理解功能來偵測和篩選不需要的內容 (包括印刷錯誤等內容修改),並支援多達 60 種語言。
Bedrock 防護機制提供可設定的安全措施,協助偵測和阻止有害的內容和提示攻擊,定義主題以拒絕和禁止特定主題,並且協助編輯來自輸入提示和模型回應的個人身分識別資訊 (PII),例如個人資料。此外,Bedrock 防護機制有助於偵測和阻止模型幻覺,並使用自動推理檢查以識別、糾正和解釋模型回應中的事實主張。防護機制可在任何基礎模型上套用,包括使用 Amazon Bedrock 託管的模型、自我託管模型以及 Bedrock 之外使用 ApplyGuardrail API 的第三方模型,進而提供一致的使用者體驗,並協助標準化安全和隱私控制項。
新的標準方案可提供更強大的提示與回應變化偵測能力、針對所有類別內容篩選條件 (包括提示攻擊) 的強化防禦,以及更廣泛的語言支援,進而增強 Bedrock 防護機制內的內容篩選器和拒絕主題保護措施。改進的提示攻擊篩選條件能夠清楚地在後端識別越獄和提示注入,同時保護系統免受其他威脅 (包括輸出操縱) 影響。若要存取標準方案的功能,客戶必須明確選擇使用 Bedrock 防護機制的跨區域推論。
若要進一步了解,請參閱技術文件和 Bedrock 防護機制產品頁面。