Amazon SageMaker AI теперь поддерживает настройку бессерверного обучения с подкреплением еще для 12 моделей
Amazon SageMaker AI теперь поддерживает настройку бессерверных моделей и обучения с подкреплением еще для 12 моделей с открытыми весами, позволяя тонко настраивать и оценивать их работу без необходимости выделять и обслуживать инфраструктуру. Новыми поддерживаемыми моделями являются: gpt-oss-120b, Qwen2.5 72B Instruct, DeepSeek-R1-Distill-Llama-70B, Qwen3 14B, DeepSeek-R1-Distill-Qwen-14B, Qwen2.5 14B Instruct, DeepSeek-R1-Distill-Llama-8B, DeepSeek-R1-Distill-Qwen-7B, Qwen3 4B, Meta Llama 3.2 3B Instruct, Qwen3 1.7B и DeepSeek-R1-Distill-Qwen-1.5B. Благодаря данному расширению вы можете использовать для этих моделей методы настройки на основе обучения с учителем (supervised fine-tuning, SFT), прямой оптимизации предпочтений (direct preference optimization, DPO) и обучения с подкреплением (reinforcement fine-tuning, RFT), в том числе с проверяемым вознаграждением (RLVR) и по предпочтениям ИИ (RLAIF). При этом вы платите только за используемые ресурсы.
Настройка на основе обучения с подкреплением позволяет адаптировать модели к сложным задачам логических рассуждений в конкретных предметных областях, для которых использование только традиционных методов SFT оказывается неэффективным. При использовании RLVR вы можете повышать точность модели на основе проверяемых задач, таких как генерация кода, математика или структурированное извлечение данных, предоставляя сигналы вознаграждения в зависимости от правильности ответов. Метод RLAIF использует обратную связь от искусственного интеллекта для адаптации работы модели под ваши предпочтения в области качества и безопасности. Эти методы доступны как для поддерживаемых ранее, так и для новых добавленных моделей, без необходимости настраивать кластеры, планировать ресурсы или иметь прошлый опыт распределенного обучения.
Вышеуказанные модели и методы настройки доступны в следующих регионах: Восток США (Северная Вирджиния), Запад США (Орегон), Азиатско-Тихоокеанский регион (Токио) и ЕС (Ирландия). Для начала ознакомьтесь со страницей продукта, посвященной настройке моделей Amazon SageMaker AI, и со страницей цен на Amazon SageMaker AI (вкладка «Настройка моделей»), чтобы увидеть полный список моделей, методов и цен.