SageMaker Canvas desbloquea el ML sin código y la preparación de datos a escala de petabytes

Publicado en: 16 de ago de 2024

Amazon SageMaker Canvas ahora permite a las empresas aprovechar todo el potencial de sus datos al permitir la compatibilidad con conjuntos de datos a escala de petabytes. A partir de hoy, puede preparar grandes conjuntos de datos de forma interactiva, crear flujos de datos de extremo a extremo e iniciar experimentos de AutoML en petabytes, lo que supone un salto sustancial con respecto al límite anterior de 5 GB. Con más de 50 conectores, una interfaz intuitiva de “chat con datos” y compatibilidad con petabytes, Canvas proporciona una solución de machine learning escalable y con poco código o sin código para gestionar casos de uso empresarial reales.

A partir de hoy, Canvas le ofrece nuevas técnicas de muestreo, como el aleatorio y el estratificado, que permiten muestrear hasta 200 000 filas, lo que representa un aumento de diez veces. Esto facilita la recopilación de información sobre la calidad de los datos y la comprensión del impacto de sus transformaciones de datos de forma interactiva antes de procesar todo el conjunto de datos, aprovechando nuestra nueva integración perfecta con EMR sin servidor. Canvas escala automáticamente el procesamiento de más de 5 GB de datos entre el muestreo, la preparación, la creación de modelos y la inferencia a EMR sin servidor, liberando todo el potencial predictivo de sus datos a través de una experiencia intuitiva. El uso de EMR sin servidor implica costos adicionales de precios de EMR.

La nueva compatibilidad con petabytes y la experiencia interactiva mejorada están disponibles en todas las regiones de AWS en las que se ofrece SageMaker Canvas.

Para comenzar con ML sin código y la preparación de conjuntos de datos grandes, habilite la “configuración de procesamiento de datos de gran tamaño” en su dominio y perfil de usuario de Canvas mediante nuestra documentación técnica, y aprenda a usar la nueva función en el blog de machine learning de AWS. Los usuarios actuales deben actualizar las configuraciones de sus dominios de SageMaker según la documentación, cerrar sesión en el espacio de trabajo de Canvas y volver a iniciarla para acceder a la versión más reciente.