Amazon Bedrock Guardrails, 콘텐츠 필터 및 금지된 주제를 위한 티어 도입

게시된 날짜: 2025년 6월 24일

Amazon Bedrock Guardrails는 콘텐츠 필터 및 금지된 주제에 대한 티어를 도입하여, 고객 사용 사례에 따라 기능 선택과 언어 지원 확대에 대한 유연성 및 사용 편의성을 제공합니다. 이번에 새롭게 도입된 스탠다드 티어에서는 오타와 같은 변형 표현까지 탐지할 수 있는 향상된 컨텍스트 이해 기반의 콘텐츠 필터링 기능과 함께 최대 60개의 언어를 지원합니다.

Bedrock Guardrails는 구성 가능한 보호 조치를 제공하여 유해한 콘텐츠와 프롬프트 공격을 탐지 및 차단하고, 특정 주제를 거부 및 허용하지 않을 주제를 정의하고, 입력 프롬프트 및 모델 응답에서 개인 데이터와 같은 개인 식별 정보(PII)를 수정하는 데 도움이 됩니다. 또한 Bedrock Guardrails는 자동 추론 검사를 사용하여 모델 할루시네이션을 탐지 및 차단하고, 모델 응답에서 사실적 주장을 식별, 수정 및 설명하는 데 도움이 됩니다. Guardrails는 Amazon Bedrock으로 호스팅되는 모델, 자체 호스팅 모델, ApplyGuardRail API를 사용하는 Bedrock 이외의 서드 파티 모델 등 모든 파운데이션 모델에 적용할 수 있어 일관된 사용자 경험을 제공하고 안전 및 개인 정보 보호 제어를 표준화하는 데 도움이 됩니다.

새로운 스탠다드 티어는 프롬프트 및 응답의 다양한 변형 표현에 대한 탐지 성능 향상, 모든 유형의 콘텐츠 필터*프롬프트 공격 등)에 대한 방어 수준 강화, 광범위한 언어 지원을 제공함으로써 Bedrock Guardrails 내 콘텐츠 필터 및 금지된 주제 보호 기능을 강화합니다. 개선된 프롬프트 공격 필터는 백엔드에서 탈옥과 프롬프트 인젝션을 명확히 구분하고, 출력 조작 등의 다른 위협으로부터도 보호합니다. 스탠다드 티어의 기능을 사용하려는 고객은 Bedrock Guardrails에서 교차 리전 추론을 명시적으로 옵트인해야 합니다.

기술 설명서Bedrock Guardrails 제품 페이지에서 자세한 내용을 알아보세요.