Amazon SageMaker AI, yapay zeka temsilcisi modeli özelleştirmesi için çok turlu pekiştirme öğreniminin lansmanını yaptı
Amazon SageMaker AI artık çok adımlı, temsilci destekli görevlerde modeller üzerinde ince ayar yapmak için yeni bir sunucusuz model özelleştirme tekniği olan çok yönlü pekiştirmeli öğrenme (RL) sunuyor. SageMaker AI model özelleştirmesi denetimli ince ayar, doğrulanabilir ödüllerden pekiştirmeli öğrenme (RLVR) ve yapay zeka değerlendirmesinden pekiştirmeli öğrenme (RLAIF) gibi teknikleri kullanarak temel modelleri, kendi eğitim altyapınızı kurmanın ve yürütmenin ağır yükü olmadan adapte etmenize olanak tanır. Çok turlu RL, modelleri kendi temsilci ortamınıza göre eğiterek ve bir temsilcinin bir görev boyunca aldığı tüm kararlar sırasını ödüllendirerek, hedef iş yükünüzdeki daha büyük genel amaçlı modellerin görev doğruluğunu eşleştirmek veya aşmak için daha küçük, daha düşük maliyetli modelleri uzmanlaştırmanıza yardımcı olarak bunu genişletir.
Temsilcilere çok adımlı görevleri güvenilir bir şekilde tamamlamaları için güç sağlayan modelleri eğitmek karmaşıktır, zaman alıcıdır ve genellikle oluşturulması haftalar süren özel altyapılar gerektirir. SageMaker'ın Çok turlu RL teklifi bunu sizin için halleder. Tam olarak yönetilen barındırma için Amazon Bedrock AgentCore Çalışma Zamanı üzerinde çalışan temsilcinizi veya Amazon EKS, Amazon EC2, AWS Fargate veya herhangi bir altyapıda seçtiğiniz çerçeveyi kullanarak bağlayabilirsiniz. SageMaker AI, kullanıma sunuş düzenlemesi ve gidişat verisi toplamadan eğitim ve kontrol noktası yönetimine kadar tüm eğitim döngüsünü yönetir. Yerleşik MLFlow izleme temsilci gidişatını, ödülleri ve izleri incelemenizi sağlar. Değerlendirme işleri, bir modeli bir SageMaker AI uç noktasına veya Amazon Bedrock'a dağıtmadan önce kıyaslayabilmeniz için ödül, pass@k ve gidişat ölçümlerini rapor eder. Çok turlu RL, sağlanacak veya yönetecek altyapı olmadan tamamen sunucusuz bir özellik olarak çalışır, bu nedenle yalnızca işlenen belirteçler için ödeme yaparsınız.
Çok turlu RL, Amazon SageMaker AI modeli özelleştirmesinin bir parçası olarak bugün SageMaker Stüdyosu ve SageMaker Python SDK aracılığıyla edinilebilir. Desteklenen modeller arasında us-west-2'deki Qwen 3.6 27B, Nova Lite 2.0, GPT-OSS-20B ve Gemma 31B ve us-east-1'deki Nova Lite 2.0, GPS-OSS-20B bulunur. SageMaker AI'daki çok yönlü pekiştirmeli öğrenmeyi kullanmaya başlamak için Amazon SageMaker AI belgelerini ziyaret edin.