Publicado: Dec 8, 2020
O Amazon Redshift ML possibilita que usuários de data warehouse, como analistas de dados, desenvolvedores de banco de dados e cientistas de dados, criem, treinem e implantem modelos de machine learning (ML) usando comandos SQL familiares. O Amazon Redshift é o data warehouse em nuvem mais amplamente usado e agora, com o Amazon Redshift ML, você pode aproveitar o Amazon SageMaker, um serviço de machine learning totalmente gerenciado, com linguagem SQL e sem necessidade de mover seus dados ou aprender novas habilidades.
Com o Amazon Redshift ML, por meio do Amazon SageMaker, você pode usar instruções SQL para criar e treinar modelos de machine learning com base em seus dados no Amazon Redshift e, em seguida, usar esses modelos para casos de uso como previsão de rotatividade e pontuação de risco de fraude diretamente em suas consultas e relatórios. O Amazon Redshift ML descobre e ajusta automaticamente o melhor modelo com base nos dados de treinamento usando o Amazon SageMaker Autopilot. O SageMaker Autopilot escolhe entre os melhores modelos lineares, de regressão e de classificação binária ou multiclasse.
Como alternativa, você pode escolher um tipo de modelo, como Xtreme Gradient Boosted Tree (XGBoost), um tipo de problema como regressão ou classificação e pré-processadores ou hiperparâmetros. O Amazon Redshift ML usa seus parâmetros para construir, treinar e implantar o modelo no data warehouse do Amazon Redshift. Você pode obter previsões desses modelos treinados usando consultas SQL como se estivesse invocando uma função definida pelo usuário (UDF) e aproveitar todos os benefícios do Amazon Redshift, incluindo capacidades de processamento massivamente paralelo.
O Amazon Redshift ML aproveita seus recursos de cluster existentes na previsão para que você evite cobranças adicionais do Amazon Redshift. Não há cobrança adicional do Amazon Redshift para criar ou usar um modelo, e a previsão acontece localmente em seu cluster do Amazon Redshift. Portanto, você não precisa pagar a mais, a menos que precise redimensionar seu cluster. O Amazon Redshift ML usa o Amazon SageMaker para treinar seu modelo, o que tem um custo adicional associado. Veja a página de definição de preço do Redshift para obter detalhes.
A demonstração do Redshift ML está disponível nas seguintes regiões: Leste dos EUA (Ohio), Leste dos EUA (Norte da Virginia), Oeste dos EUA (Oregon), Oeste dos EUA (São Francisco), Canadá (Central), Europa (Frankfurt), Europa (Irlanda ), Europa (Londres), Europa (Paris), Europa (Estocolmo), Ásia-Pacífico (Hong Kong), Ásia-Pacífico (Tóquio), Ásia-Pacífico (Singapura), Ásia-Pacífico (Sidney) e América do Sul (São Paulo). Para começar e saber mais, visite a documentação da demonstração ou leia esta publicação do blog.