Amazon SageMaker HyperPod accélère le déploiement de modèles open-weight
Amazon SageMaker HyperPod prend désormais en charge le déploiement de modèles de fondation « open-weight » depuis Amazon SageMaker JumpStart et de vos propres modèles ajustés depuis Amazon S3 et Amazon FSx directement sur Amazon SageMaker HyperPod. Cela vous permet d'entraîner, d'affiner et de déployer des modèles de manière fluide sur les mêmes ressources de calcul HyperPod, optimisant ainsi l'utilisation des ressources tout au long du cycle de vie des modèles
En quelques étapes rapides, vous pouvez choisir un modèle de fondation open-weight dans SageMaker JumpStart et le déployer rapidement sur votre cluster SageMaker HyperPod. SageMaker provisionne automatiquement l'infrastructure, déploie le modèle sur votre cluster, active la mise à l'échelle automatique et configure le point de terminaison SageMaker. SageMaker fait évoluer les ressources de calcul vers le haut et vers le bas grâce à la gouvernance des tâches HyperPod en fonction de l'évolution du trafic sur les terminaux du modèle, et publie automatiquement des mesures sur le tableau de bord d'observabilité HyperPod afin de fournir une visibilité complète sur les performances du modèle.
Vous pouvez déployer des modèles à partir de SageMaker JumpStart dans toutes les régions AWS où HyperPod est disponible, à savoir USA Est (Virginie du Nord), USA Ouest (Californie du Nord), USA Ouest (Oregon), Asie-Pacifique (Mumbai), Asie-Pacifique (Singapour), Asie-Pacifique (Sydney) et Asie-Pacifique (Tokyo), Europe (Francfort), Europe (Irlande), Europe (Londres), Europe (Stockholm) et Amérique du Sud (São Paulo).
Pour en savoir plus, consultez la page Web, le blog et la documentation de SageMaker HyperPod.