Ограничения для Amazon Bedrock

Внедрите средства защиты, адаптированные к требованиям ваших приложений и политикам ответственного подхода к искусственному интеллекту

Ответственно создавайте приложения искусственного интеллекта с помощью ограничений для Amazon Bedrock

Посмотрите демонстрационные материалы о том, как создавать и применять персонализированные ограничения с помощью базовых моделей (FM), чтобы внедрять ответственные политики в отношении искусственного интеллекта в приложения для генеративного искусственного интеллекта.

Стабильный уровень безопасности искусственного интеллекта во всех приложениях

Сервис ограничений для Amazon Bedrock оценивает вводимую пользователем информацию и ответы базовой модели на основе политик для конкретных сценариев использования и обеспечивает дополнительный уровень безопасности независимо от используемой FM. Ограничения можно применять ко всем большим языковым моделям (LLM) на Amazon Bedrock, включая тщательно настроенные модели. Клиенты могут создать несколько ограничений, каждое из которых имеет различную комбинацию элементов управления, и использовать эти ограничения в разных приложениях и сценариях использования. 

Снимок экрана пользовательского интерфейса

Блокируйте нежелательные темы в приложениях с генеративным искусственным интеллектом

Организации признают необходимость управления взаимодействиями в приложениях с генеративным ИИ для создания релевантной и безопасной среды работы пользователей. Им требуется максимально адаптировать взаимодействие, чтобы оно оставалось в рамках актуальных для их бизнеса тем и соответствовало политике компании. Используя краткое описание на естественном языке, сервис ограничений для Amazon Bedrock позволяет определить набор тем, которых следует избегать в контексте приложения. Он обнаруживает и блокирует вводимую пользователем информацию и ответы базовой модели из запрещенных категорий. Например, помощник в банковской системе можно разработать таким образом, чтобы он избегал тем, связанных с инвестициями.

ограничения для фильтров контента amazon bedrock

Фильтруйте нежелательный контент в соответствии с ответственным подходом к искусственному интеллекту

Сервис «Ограничения для Amazon Bedrock» предоставляет фильтры контента с настраиваемыми пороговыми значениями для фильтрации вредоносного контента по категориям «ненависть», «оскорбления», «секс», «насилие», «неправомерное поведение» (включая преступную деятельность) и «оперативные атаки» (быстрое внедрение и взлом). В большинстве базовых моделей уже предусмотрены встроенные средства защиты, предотвращающие появление нежелательных ответов. В дополнение к этим средствам защиты функция ограничений позволяет настраивать пороговые значения для различных категорий, чтобы отфильтровать нежелательные взаимодействия. Увеличение эффективности фильтра повышает агрессивность фильтрации. Функция ограничений автоматически оценивает как запросы пользователей, так и ответы базовой модели, чтобы выявить и предотвратить появление контента, относящегося к запрещенным категориям. Например, на сайте электронной коммерции можно создать онлайн-помощник, позволяющий исключить использование неприемлемых выражений, таких как враждебные высказывания или оскорбления.

ограничения для amazon bedrock, запрещенные темы

Редактирование чувствительной информации (позволяющей установить личность) для защиты конфиденциальности

Сервис «Ограничения для Amazon Bedrock» способен обнаружить определенный чувствительный контент, например информацию, позволяющую установить личность (PII), в пользовательских сообщениях и ответах базовой модели. Можно выбрать из списка предварительно определенной PII или определить собственный тип чувствительной информации с помощью регулярных выражений (RegEx). В зависимости от варианта использования вы можете выборочно отклонять входные данные, содержащие чувствительную информацию, или редактировать их в ответах базовой модели. Например, вы можете редактировать личную информацию пользователей в процессе создания сводок по расшифровкам разговоров клиентов и операторов в колл-центре.

псевдонимизация и значок gdpr