Amazon Bedrock 강화 미세 조정, OpenAI 호환 API를 사용하는 오픈 웨이트 모델에 대한 지원 추가

게시된 날짜: 2026년 2월 17일

Amazon Bedrock은 이제 OpenAI GPT-OSS 모델과 Qwen 모델을 비롯한 인기 있는 오픈 웨이트 모델에 강화 미세 조정(RFT) 지원을 확장하고 OpenAI 호환 미세 조정 API를 도입합니다. 이러한 기능 덕분에 개발자는 깊이 있는 기계 학습 전문 지식이나 레이블이 지정된 대량의 데이터 없이 오픈 웨이트 모델 정확도를 쉽게 개선할 수 있습니다. Amazon Bedrock의 강화 미세 조정은 엔드 투 엔드 사용자 지정 워크플로를 자동화하므로 모델은 기존의 대규모 교육 데이터세트 대신 작은 프롬프트 세트를 사용하여 가능한 여러 응답에 대한 피드백으로부터 학습할 수 있습니다. 강화 미세 조정을 통해 고객은 높은 품질을 유지하면서 더 작고 빠르며 비용 효율적인 모델 버전을 사용할 수 있습니다.

조직은 고유한 비즈니스 요구 사항에 맞게 파운데이션 모델을 적응시키느라 어려움을 겪곤 하는데, 이로 인해 성능이 제한적인 일반 모델과 특화된 인프라 및 전문 지식을 요하는 복잡하고 값비싼 사용자 지정 파이프라인 간에 상충이 발생합니다. Amazon Bedrock은 안전한 완전 관리형 강화 미세 조정 환경을 제공하여 이러한 복잡성을 없앱니다. 고객은 코드 생성, 수학적 추론 같은 객관적 태스크와 지시 준수 또는 대화 품질 같은 주관적 태스크 모두를 고려한 내장 템플릿을 비롯해 검증 가능한 규칙 기반 평가자 또는 AI 기반 심사자를 사용하여 보상 함수를 정의할 수 있습니다. 훈련 중에 고객은 사용자 지정 평가 로직을 위해 AWS Lambda 함수를 사용하고, 중간 모델 체크포인트에 액세스하여 모델을 평가, 디버깅하고 최적 성능 모델을 선택할 수 있으므로 반복 속도와 훈련 효율성이 개선됩니다. 사용자 지정 프로세스 전반에 걸쳐 모든 독점 데이터는 안전하게 관리되는 AWS 환경 내에 유지됩니다.

이번 출시에서 지원되는 모델은 qwen.qwen3-32b 및 openai.gpt-oss-20b입니다. 미세 조정이 완료되면 고객은 추가 배포 단계 없이 Amazon Bedrock의 OpenAI 호환 API(Responses API, Chat Completions API)를 통해 미세 조정된 모델을 온디맨드 추론에 즉시 사용할 수 있습니다. 자세한 내용은 Amazon Bedrock 설명서를 참조하세요.