Publicado: Oct 23, 2023
O Amazon SageMaker Feature Store oferece suporte à incorporação de fontes de dados personalizadas em pipelines de processamento de atributos. Você pode criar atributos de ML mais sofisticados e variados incorporando diversas fontes de dados e definindo funções de transformação para execução. O SageMaker Feature Store se encarrega de processar os dados para atributos de ML.
Com esse lançamento, você pode se conectar a fontes de dados de streaming, como o Amazon Kinesis, e criar transformações com o Spark Structured Streaming, um mecanismo de processamento de streams escalável e tolerante a falhas para processamento de dados em tempo real. Você também pode se conectar a data warehouses como Amazon Redshift, Snowflake e Databricks para processar atributos em lote e iniciar o processamento de atributos com base em um agendamento ou acionamento usando as regras do Amazon EventBridge. O Amazon SageMaker Feature Store cria e gerencia os pipelines e grava em seus grupos de atributos para uso no fornecimento e treinamento de modelos de ML. Você pode acompanhar as execuções agendadas do pipeline, visualizar a linhagem para rastrear atributos até as fontes de dados e visualizar o código de processamento de atributos em um único ambiente no Amazon SageMaker Studio.
Para saber mais, consulte a documentação aqui. Para começar a usar, acesse o SageMaker Studio no console do Amazon SageMaker.