Guardrail per Amazon Bedrock introduce livelli per i filtri dei contenuti e degli argomenti vietati

Inserito il: 24 giu 2025

Guardrail per Amazon Bedrock introduce livelli per i filtri dei contenuti e gli argomenti vietati, offrendo maggiore flessibilità e semplicità d'uso nella selezione delle funzionalità e un supporto linguistico ampliato in base ai casi d'uso dei clienti. Con il nuovo livello Standard, ora Guardrail rileva e filtra contenuti indesiderati con una migliore comprensione contestuale, inclusi adattamenti come errori tipografici, e supporta fino a 60 lingue.

Bedrock Guardrail fornisce misure di sicurezza configurabili per favorire il rilevamento e il blocco di contenuti dannosi e di attacchi ai prompt e per definire argomenti specifici da vietare e non consentire, quindi aiuta a oscurare le informazioni di identificazione personale (PII) come i dati personali dai prompt di input e dalle risposte modello. Inoltre, Bedrock Guardrail aiuta a rilevare e bloccare le allucinazioni dei modelli, nonché a identificare, correggere e spiegare le affermazioni fattuali nelle risposte del modello utilizzando i controlli del ragionamento automatico. Guardrail può essere applicato a qualsiasi modello di fondazione, inclusi i modelli ospitati su Amazon Bedrock, con hosting autonomo e di terze parti esterni a Bedrock, tramite l'API ApplyGuardrail, offrendo un'esperienza utente coerente e contribuendo a standardizzare i controlli di sicurezza e privacy.

Il nuovo livello Standard potenzia le protezioni dei filtri dei contenuti e degli argomenti vietati all'interno di Guardrail per Bedrock, offrendo un miglior rilevamento delle variazioni di prompt e risposta, una difesa rafforzata contro tutte le categorie di filtri dei contenuti, inclusi gli attacchi ai prompt, e un supporto linguistico più esteso. Il filtro migliorato per gli attacchi ai prompt distingue chiaramente tra jailbreak e iniezione di prompt nel backend, offrendo al contempo protezione da altre minacce, come la manipolazione degli output. Per accedere alle funzionalità del livello Standard, i clienti devono attivare esplicitamente l'inferenza tra regioni con Guardrail per Bedrock.

Per ulteriori informazioni consulta la documentazione tecnica e la pagina del prodotto di Guardrail per Bedrock.