Publicado en: Apr 3, 2023
SageMaker Canvas ahora admite más de 45 fuentes de datos que se pueden utilizar para el machine learning (ML) sin código, como Amazon Athena y aplicaciones SaaS de terceros, como Snowflake, Salesforce y SAP OData. Canvas es una interfaz interactiva que permite a los analistas generar predicciones de ML sin necesidad de tener experiencia en esta tecnología ni tener que escribir una sola línea de código.
La ingesta de datos es un paso fundamental en ML para alimentar a los algoritmos con datos de alta calidad para modelar un problema con precisión. La proliferación de las aplicaciones SaaS ha creado una dispersión de datos entre los sistemas, lo que hace que la adquisición de datos sea compleja y lleve mucho tiempo. Antes, los clientes tenían que recuperar y transferir datos desde la aplicación SaaS deseada a una fuente Canvas compatible (Amazon S3, Amazon Redshift, Snowflake o un disco local) para utilizarlos en ML sin código. La naturaleza manual de este proceso a menudo hace que queden datos valiosos fuera del proceso de ML.
Ahora, Canvas permite a los clientes sacar provecho de los datos almacenados en distintas fuentes al admitir la ingesta de datos de más de 45 fuentes. Nos asociamos con Amazon AppFlow, un servicio que permite a los clientes transferir datos de forma segura a servicios de AWS, como S3. Una vez transferidos, puede acceder a sus datos en Canvas, donde puede buscar tablas, unir tablas de datos entre fuentes, previsualizar los datos y escribir consultas de Athena para importar los datos correctos. Una vez importados los datos, puede aprovechar todas las funciones de Canvas existentes, como crear un modelo de ML, ver datos de explicabilidad o generar predicciones.
La compatibilidad para esta función ya está disponible en todas las regiones de AWS en las que está disponible Canvas. Para empezar a importar sus datos de estas más de 45 fuentes, consulte la documentación de Canvas.