Amazon Bedrock 防護機制

實施根據您的應用程式需求和負責任的 AI 政策自訂的保護

利用 Amazon Bedrock 的防護機制建立負責任的 AI 應用程式

觀看有關如下方面的示範:如何使用基礎模型 (FM) 建立和套用自訂量身定制的防護機制,以在您的生成式 AI 應用程式中實作負責任的 AI 政策。

為所有應用程式帶來一致水平的 AI 安全

Amazon Bedrock 防護機制會根據使用案例特定的政策來評估使用者輸入和 FM 回應,並提供額外的防護層,無論基礎 FM 為何。防護機制可應用於 Amazon Bedrock 上的所有大型語言模型 (LLM),包括微調的模型。客戶可以建立多個防護機制,每個防護機制都設定不同的控制項組合,並在不同的應用程式和使用場景中使用這些防護機制。 

UI 螢幕擷取畫面

在生成式 AI 應用程式中封鎖不需要的主題

組織可識別需要管理生成式 AI 應用程式內的互動,以提供相關且安全的使用者體驗。使用者希望進一步自訂互動,以保持主題與其業務相關,並符合公司政策。Amazon Bedrock 防護機制可讓您使用簡短的自然語言,描述在應用程式環境中定義一組要避免的主題。防護機制可偵測並封鎖屬於受限制主題的使用者輸入內容和 FM 回應。例如,可以設計銀行助理以避免與投資建議相關的主題。

Amazon Bedrock 防護機制內容篩選器

根據您負責任的 AI 政策篩選有害內容

Amazon Bedrock 防護機制提供具有可設定閾值的內容篩選條件,以篩選涉及仇恨、辱罵、性、暴力、不當行為 (包含犯罪活動) 以及提示攻擊 (提示注入和破解) 的有害內容。大多數 FM 已提供內建保護,以防止產生有害回應。除了這些保護措施之外,防護機制還可以讓您在不同類別中設定閾值,以篩選出有害互動。增加篩選條件的強度會提升篩選的侵略性。防護機制會自動評估使用者查詢和 FM 回應,以偵測並協助防止屬於受限類別的內容。例如,電子商務網站可以設計在線助理,以避免使用不當的語言,例如仇恨言論或羞辱。

Amazon Bedrock 防護機制拒絕的主題

編輯敏感資訊 (PI) 以保護隱私權

Amazon Bedrock 防護機制可讓您偵測使用者輸入內容和 FM 回應中的個人身分識別資訊 (PII) 等敏感內容。可以從預先定義的 PII 清單中選取,也使用規則表達式 (regex) 定義自訂敏感資訊類型。依據使用場景,您可以有選擇地拒絕包含敏感資訊的輸入內容,或在 FM 回應中編輯這些資訊。例如,您可以編輯使用者的個人資訊,同時根據呼叫中心的客戶和客服人員對話記錄產生摘要。

偽名化和 gdpr 圖示