Publicado en: Dec 8, 2020
Amazon Redshift ML hace posible que los usuarios de los almacenes de datos, como los analistas de datos, los desarrolladores de bases de datos y los científicos de datos, creen, entrenen e implementen modelos de aprendizaje automático (ML) mediante los conocidos comandos SQL. Amazon Redshift es el almacén de datos en la nube más utilizado y, con Amazon Redshift ML, ahora puede aprovechar Amazon SageMaker, un servicio de aprendizaje automático totalmente gestionado, que utiliza SQL sin tener que mover sus datos o aprender nuevas habilidades.
Con Amazon Redshift ML con tecnología de Amazon SageMaker, puede utilizar declaraciones SQL para crear y entrenar modelos de aprendizaje automático a partir de sus datos en Amazon Redshift y luego utilizar estos modelos para casos de uso como la predicción de abandono de clientes y la puntuación de riesgo de fraude directamente en sus consultas e informes. Amazon Redshift ML descubre y ajusta automáticamente el mejor modelo basado en los datos de entrenamiento que utiliza Amazon SageMaker Autopilot. SageMaker Autopilot elige entre la mejor regresión, clasificación binaria o multiclase y modelos lineales.
También se puede elegir un tipo de modelo, como el árbol Xtreme Gradient Boosted (XGBoost), un tipo de problema, como la regresión o la clasificación, y preprocesadores o hiperparámetros. Amazon Redshift ML utiliza sus parámetros para crear, entrenar e implementar el modelo en el almacén de datos de Amazon Redshift. Puede obtener predicciones de estos modelos entrenados mediante consultas SQL como si estuviera invocando una función definida por el usuario y aprovechar todos los beneficios de Amazon Redshift, incluidas las capacidades de procesamiento masivo en paralelo.
Amazon Redshift ML aprovecha los recursos de su clúster existente para la predicción, de modo que puede evitar los cargos adicionales de Amazon Redshift. No hay ningún cargo adicional de Amazon Redshift por crear o usar un modelo, y la predicción se realiza localmente en su clúster Amazon Redshift, por lo que no tiene que pagar extra a menos que necesite redimensionar su clúster. Amazon Redshift ML utiliza Amazon SageMaker para entrenar su modelo, lo cual tiene un costo adicional asociado. Consulte la página de precios de Redshift para más detalles.
La versión preliminar de Redshift ML está disponible en las siguientes regiones: EE. UU. Este (Ohio), EE. UU. Este (Virginia del norte), EE. UU. Oeste (Oregón), EE. UU. Oeste (San Francisco), Canadá (Central), UE (Fráncfort), UE (Irlanda), UE (Londres), UE (París), UE (Estocolmo), Asia-Pacífico (Hong Kong) Asia-Pacífico (Tokio), Asia-Pacífico (Singapur), Asia-Pacífico (Sídney) y América del Sur (São Paulo). Para comenzar y obtener más información, consulte la documentación de esta versión preliminar o lea esta entrada de blog.