Amazon Bedrock 的防護機制 (預覽版)

實施根據您的應用程式需求和負責任的 AI 政策自訂的保護
Amazon Bedrock 防護機制首頁

為所有應用程式帶來一致水平的 AI 安全

Amazon Bedrock 防護機制會根據使用案例特定的政策來評估使用者輸入和 FM 回應,並提供額外的防護層,無論基礎 FM 為何。防護機制可跨 FM 使用,包括 Anthropic Claude、Meta Llama 2、Cohere Command、AI21 Labs Jurassic 和 Amazon Titan Text,以及微調的模型。客戶可以建立多個防護機制,每個防護機制都設定了不同的控制項組合,並在不同的應用程式和使用案例中使用這些防護機制。 防護機制也可與 Amazon Bedrock 客服人員整合,以建置符合您負責任的 AI 政策的生成式 AI 應用程式。

Amazon Bedrock 防護機制拒絕的主題

在生成式 AI 應用程式中封鎖不需要的主題

組織可識別需要管理生成式 AI 應用程式內的互動,以提供相關且安全的使用者體驗。使用者希望進一步自訂互動,以保持主題與其業務相關,並符合公司政策。Amazon Bedrock 防護機制可讓您使用簡短的自然語言,描述在應用程式環境中定義一組要避免的主題。防護機制可偵測並封鎖屬於受限制主題的使用者輸入內容和 FM 回應。例如,可以設計銀行助理以避免與投資建議相關的主題。

Amazon Bedrock 防護機制內容篩選器

根據您負責任的 AI 政策篩選有害內容

Amazon Bedrock 防護機制提供具有可設定閾值的內容篩選器,以篩選仇恨、辱罵、性和暴力類別的有害內容。大多數 FM 已提供內建保護,以防止產生有害回應。除了這些保護措施之外,防護機制還可以讓您在不同類別中設定閾值,以篩選出有害互動。防護機制會自動評估使用者查詢和 FM 回應,以偵測並協助防止屬於受限類別的內容。例如,電子商務網站可以設計在線助理,以避免使用不當的語言,例如仇恨言論或羞辱。

偽名化和 gdpr 圖示

編輯 PII 以保護使用者隱私 (即將推出)

Amazon Bedrock 防護機制可讓您偵測使用者輸入內容,以及 FM 回應中的個人身分識別資訊 (PII)。根據使用案例,您可以有選擇地拒絕包含 PII 的輸入內容,或在 FM 回應中編輯 PII。例如,您可以編輯使用者的個人資訊,同時根據呼叫中心的客戶和客服人員對話記錄產生摘要。