Amazon Bedrock 모델 평가, 유럽(취리히)에서 사용 가능
Amazon Bedrock의 모델 평가 기능을 활용하면 파운데이션 모델을 평가 및 비교한 후 사용 사례에 가장 적합한 모델을 선택할 수 있습니다. Amazon Bedrock은 LLM-as-a-judge, 프로그래밍 방식 평가, 인적 평가를 선택할 수 있는 옵션을 제공합니다. LLM-as-a-judge는 정확성, 완전성, 일관성 등의 지표와 답변 거부, 유해성 등의 책임 있는 AI 지표에 사용할 수 있습니다. 프로그래밍 방식 평가는 정확성, 강건성, 유해성 등의 지표에 대한 알고리즘을 제공합니다. 아울러 이러한 지표 또는 호감도, 스타일 등의 주관적 지표나 사용자 지정 지표의 경우에는 클릭 몇 번으로 인적 평가 워크플로를 설정할 수 있습니다. 인적 평가 워크플로에서는 사내 직원이나 AWS 관리형 담당 팀을 검토자로 활용할 수 있습니다. 모델 평가 기능에서 기본 제공되는 엄선된 데이터 세트를 사용할 수도 있고 원하는 데이터 세트를 추가할 수도 있습니다. 모델 평가 기능은 현재 유럽(취리히) 리전에서 사용할 수 있습니다.
Amazon Bedrock의 모델 평가는 현재 이러한 리전에서 제공되며, 평가 유형의 가용성 여부는 리전별로 다릅니다.
Amazon Bedrock의 모델 평가에 대해 자세히 알아보려면 Amazon Bedrock 모델 평가 페이지를 살펴보세요. 시작하려면 AWS Management Console에서 Amazon Bedrock에 로그인하거나 Amazon Bedrock API를 사용하세요.