Barreras de protección para Amazon Bedrock
Implemente medidas de seguridad personalizadas según los requisitos de su aplicación y las políticas de IA responsablesCree aplicaciones de IA responsables con barreras de protección para Amazon Bedrock
Vea demostraciones sobre cómo crear y aplicar barreras de protección personalizadas con modelos fundacionales (FM) a fin de implementar políticas de IA responsables en sus aplicaciones de IA generativa.
Ofrezca un nivel uniforme de seguridad de IA en todas sus aplicaciones
Las barreras de protección para Amazon Bedrock evalúan las entradas de los usuarios y las respuestas del FM en función de políticas específicas para cada caso de uso y proporcionan una capa adicional de protección independientemente del FM subyacente. Las barreras de protección se pueden aplicar en todos los modelos de lenguaje de gran tamaño (LLM) de Amazon Bedrock, incluidos los modelos perfeccionados. Los clientes pueden crear varias barreras de protección, cada una configurada con una combinación diferente de controles, y utilizarlas en diferentes aplicaciones y casos de uso.
Bloquee temas no deseados en sus aplicaciones de IA generativa
Las organizaciones reconocen la necesidad de gestionar las interacciones dentro de las aplicaciones de IA generativas para ofrecer una experiencia de usuario relevante y segura. Quieren personalizar aún más las interacciones para centrarse en temas relevantes para su negocio y alinearse con las políticas de la empresa. Con una breve descripción en lenguaje natural, la barrera de protección de Amazon Bedrock le permite definir un conjunto de temas que debe evitar en el contexto de su aplicación. La barrera de protección detecta y bloquea las entradas de los usuarios y las respuestas del FM que entran en los temas restringidos. Por ejemplo, se puede diseñar un asistente bancario para evitar temas relacionados con el asesoramiento de inversiones.
Filtre el contenido dañino en función de sus barreras de protección responsables de las políticas de IA
Las barreras de protección para Amazon Bedrock proporcionan filtros de contenido con umbrales configurables para filtrar el contenido dañino en las categorías de odio, insultos, sexo, violencia, mala conducta (incluida la actividad delictiva) y ataque rápido (inyección de prompts y jailbreak). La mayoría de los modelos fundacionales (FM) ya proporcionan protecciones integradas para evitar la generación de respuestas dañinas. Además de estas protecciones, las barreras de protección permiten configurar umbrales en las diferentes categorías para filtrar las interacciones dañinas. El aumento de la potencia del filtro aumenta la agresividad del filtrado. Las barreras de protección evalúan automáticamente tanto las consultas de los usuarios como las respuestas del FM para detectar y ayudar a prevenir el contenido que entra en categorías restringidas. Por ejemplo, un sitio de comercio electrónico puede diseñar su asistente en línea para evitar el uso de lenguaje inapropiado, como la incitación al odio o los insultos.
Elimine la información confidencial (PII) para proteger la privacidad
Las barreras de protección para Amazon Bedrock le permiten detectar contenido confidencial, como la información de identificación personal (PII) en las entradas de los usuarios y en las respuestas del FM. Puede seleccionar de una lista de PII predefinidas o definir un tipo de información confidencial personalizado mediante expresiones regulares (RegEx). Según el caso de uso, puede rechazar de forma selectiva las entradas que contienen información sensible o redactarla en las respuestas del FM. Por ejemplo, puede redactar la información personal de los usuarios mientras genera resúmenes a partir de las transcripciones de las conversaciones entre clientes y agentes en un centro de llamadas.
Bloquee el contenido inapropiado con un filtro de palabras personalizado
Las barreras de protección para Amazon Bedrock le permiten configurar un conjunto de palabras o frases personalizadas que desea detectar y bloquear en la interacción entre los usuarios y las aplicaciones de IA generativa. Esto también le permitirá detectar y bloquear blasfemias, así como palabras personalizadas específicas, como nombres de competidores u otras palabras ofensivas.