Publié le: Dec 8, 2020
Amazon Redshift ML permet aux utilisateurs d'entrepôts de données tels que les analystes de données, les développeurs de bases de données et les scientifiques des données, de créer, d'entraîner et de déployer des modèles de Machine Learning en utilisant des commandes SQL courantes. Amazon Redshift est l'entrepôt de données cloud le plus utilisé et, avec Amazon Redshift ML, vous pouvez désormais utiliser Amazon SageMaker, un service de Machine Learning entièrement géré, en utilisant SQL et sans déplacer vos données ni avoir à acquérir de nouvelles compétences.
Avec Amazon Redshift ML mû par Amazon SageMaker, vous pouvez utiliser des instructions SQL pour créer et entraîner des modèles de Machine Learning à partir de vos données présentes dans Amazon Redshift, puis utiliser ces modèles pour des cas d'utilisation tels que la prévision des désabonnements et la notation du risque de fraude, directement dans vos requêtes et rapports. Amazon Redshift ML trouve et ajuste automatiquement le meilleur modèle sur la base des données d'entraînement, en utilisant le pilote automatique Amazon SageMaker Autopilot. SageMaker Autopilot choisit parmi les meilleurs modèles de régression, de classification binaire ou multi-classes et de modèles linéaires.
Vous pouvez également choisir un type de modèle tel que l'arbre Xtreme Gradient Boosted (XGBoost), un type de problème comme la régression ou la classification, et des préprocesseurs ou des hyperparamètres. Amazon Redshift ML utilise vos paramètres pour construire, entraîner et déployer le modèle dans l'entrepôt de données Amazon Redshift. Vous pouvez obtenir des prédictions à partir de ces modèles entraînés en utilisant des requêtes SQL comme si vous invoquiez une fonction définie par l'utilisateur (UDF) et tirer parti de tous les avantages d'Amazon Redshift, notamment des capacités de traitement parallèle massives.
Amazon Redshift ML exploite les ressources existantes de votre cluster pour la prédiction, pour que vous puissiez éviter les frais supplémentaires d'Amazon Redshift. Il n'y a pas de frais supplémentaires Amazon Redshift pour la création ou l'utilisation d'un modèle, et la prédiction se fait localement dans votre cluster Amazon Redshift, donc vous n'avez pas à payer de supplément, sauf si vous avez besoin de redimensionner votre cluster. Amazon Redshift ML utilise Amazon SageMaker pour entraîner votre modèle, ce qui dans ce cas implique un coût supplémentaire. Consultez la page de tarification Redshift pricing page pour plus de détails.
L'aperçu de Redshift ML est disponible dans les régions suivantes : USA Est (Ohio), USA Est (Virginie du Nord), USA Ouest (Oregon), USA Ouest (San Francisco), Canada (Centre), UE (Francfort), UE (Irlande), UE (Londres), UE (Paris), UE (Stockholm), Asie-Pacifique (Hong Kong), Asie-Pacifique (Tokyo), Asie-Pacifique (Singapour), Asie-Pacifique (Sydney) et Amérique du Sud (São Paulo). Pour démarrer et en savoir plus, visitez la documentation en aperçu, ou lisez ce blog post.