Amazon Web Services 한국 블로그

Amazon Bedrock Guardrails – 책임 있는 AI 정책에 맞춘 맞춤화된 보호 장치 구현 (미리 보기)

책임 있는 인공 지능(AI) 전략의 일환으로 이제 Amazon Bedrock Guardrails(미리 보기)을 사용하여 사용 사례와 책임 있는 AI 정책에 맞게 사용자 지정된 보호 장치를 구현함으로써 사용자와 생성형 AI 애플리케이션 간의 안전한 상호 작용을 촉진할 수 있습니다.

AWS는 교육과 과학에 중점을 두고, AI 수명 주기 전반에 걸쳐 책임 있는 AI를 통합할 수 있도록 개발자를 지원함으로써 사람 중심의 책임 있는 방식으로 생성형 AI를 개발할 것을 약속합니다. Amazon Bedrock Guardrails을 사용하면 회사 정책 및 원칙에 따라 적절하고 안전한 사용자 경험을 제공하기 위한 보호 장치를 일관성있게 구현할 수 있습니다. 가드레일은 거부된 주제와 콘텐츠 필터를 정의하여 사용자와 애플리케이션 간의 상호 작용에서 바람직하지 않은 유해 콘텐츠를 제거하는 데 도움이 됩니다. 가드레일은 파운데이션 모델(FM)에 기본적으로 포함되어 있는 모든 보호 기능에 더해 추가 제어 계층을 제공합니다.

미세 조정된 모델과 Amazon Bedrock Agents를 포함하여 Amazon Bedrock의 모든 대규모 언어 모델(LLM)에 가드레일을 적용할 수 있습니다. 이렇게 하면 애플리케이션 전반에 기본 설정을 일관되게 배포하여 요구 사항에 따라 사용자 경험을 면밀히 관리하면서 안전하게 혁신할 수 있습니다. Amazon Bedrock Guardrails은 안전 및 개인 정보 보호 제어를 표준화하여 책임 있는 AI 목표에 부합하는 생성형 AI 애플리케이션을 구축하는 데 도움이 됩니다.

Guardrails for Amazon Bedrock

Amazon Bedrock Guardrails에서 사용할 수 있는 주요 제어 기능을 간단히 살펴보도록 하겠습니다.

주요 제어
Amazon Bedrock Guardrails을 사용하면 다음과 같은 정책 세트를 정의하여 애플리케이션 내에 보호 장치를 구현할 수 있습니다.

거부된 주제 – 간단한 자연어 설명을 사용하여 애플리케이션의 컨텍스트에서 바람직하지 않은 주제 세트를 정의할 수 있습니다. 예를 들어 은행에서 일하는 개발자라면 온라인 뱅킹 애플리케이션 안에 투자 자문을 제공하는 것을 방지하는 어시스턴트를 설정할 수 있습니다.

이 경우 ‘투자 자문’이라는 이름의 거부된 주제를 지정하고 ‘투자 자문은 수익을 창출하거나 재정상의 특정 목표를 달성하기 위한, 자금 또는 자산의 운영 또는 배분에 관한 문의, 지침 또는 권장 사항을 말한다’와 같은 자연어 설명을 제공합니다.

Guardrails for Amazon Bedrock

Guardrails for Amazon Bedrock

콘텐츠 필터 – 증오, 모욕, 성적, 폭력 카테고리에 걸쳐 유해 콘텐츠를 필터링하는 임계값을 구성할 수 있습니다. 바람직하지 않은 응답과 유해한 응답의 생성을 방지하는 보호 기능을 기본적으로 갖추고 있는 FM이 이미 많지만, 가드레일을 사용하면 사용 사례와 책임 있는 AI 정책을 기반으로 이러한 상호 작용을 원하는 수준까지 필터링할 수 있는 추가 제어 기능을 활용할 수 있습니다. 필터 강도가 높을수록 필터링이 더 엄격해집니다.

Guardrails for Amazon Bedrock

PII 수정(작업 중) – 이름, 이메일 주소, 전화번호 등의 개인 식별 정보(PII) 세트를 선택하여 FM 생성 응답에서 이를 수정하도록 하거나 PII가 포함된 경우 사용자 입력을 차단하도록 설정할 수 있습니다.

Amazon Bedrock Guardrails은 Amazon CloudWatch와 통합됩니다. 따라서 가드레일에 정의된 정책을 위반하는 사용자 입력과 FM 응답을 모니터링하고 분석할 수 있습니다.

미리 보기에 참여하기
Amazon Bedrock Guardrails은 현재 제한된 미리 보기로 사용 가능합니다. Amazon Bedrock Guardrails에 액세스하려면 일반 AWS Support 담당자를 통해 문의하세요.

미리 보기 기간에는 Amazon Titan Text, Anthropic Claude, Meta Llama 2, AI21 Jurassic 및 Cohere Command를 포함하여 Amazon Bedrock에서 사용할 수 있는 모든 대규모 언어 모델(LLM)에 가드레일을 적용할 수 있습니다. 또한 사용자 지정 모델 및 Amazon Bedrock Agents에도 가드레일을 사용할 수 있습니다.

자세히 알아보려면 Amazon Bedrock Guardrails 웹 페이지로 이동하세요.

— Antje