Publicado en: Dec 8, 2020
Amazon SageMaker Data Wrangler reduce el tiempo que tarda agregar y preparar los datos para el aprendizaje automático de semanas a minutos. Con Amazon SageMaker Data Wrangler, puede simplificar el proceso de la preparación de los datos y la ingeniería de las funciones. También, puede completar cada paso del flujo de trabajo de la preparación de los datos, incluida la selección, limpieza, exploración y visualización de los datos desde una interfaz visual única.
Para la mayoría de los modelos de aprendizaje automático, puede pasar semanas o meses agregando o preparando los datos desde diferentes orígenes: conversión, transformación y validación de los datos sin procesar a funciones que pueden utilizarse para entrenar modelos y hace predicciones. Es necesario que escriba el código para hacer transformaciones de datos, para que pueda transformar los datos en formatos que se puedan utilizar con eficiencia en un modelo, y que escriba código adicional que se pueda ejecutar a escala en un gran número de origen de datos, tiempo que se aprovecha mejor en tareas de mayor valor.
Mediante la herramienta de selección de datos de Amazon SageMaker Data Wrangler, puede elegir los datos que quiera desde varios orígenes de datos, como Amazon S3, Amazon Athena, Amazon Redshift, AWS Lake Formation y Amazon SageMaker Feature Store. Además, y puede importarlos con un solo clic. Amazon SageMaker Data Wrangler contiene más de 300 transformaciones de datos integradas, para que pueda normalizar, transformar y combinar funciones de forma rápida sin tener que escribir el código. Con las plantillas de visualización de Amazon SageMaker Data Wrangler, puede obtener una vista previa e inspeccionar que las trasformaciones se completen como lo pensó mediante su visualización en Amazon SageMaker Studio, el primer entorno de desarrollo totalmente integrado (IDE) para inteligencia artificial. Una vez que los datos estén preparados, puede crear flujos de trabajo de aprendizaje automático totalmente automatizados con Amazon SageMaker Pipelines y guardarlos para reutilizarlos en Amazon SageMaker Feature Store.
Amazon SageMaker Data Wrangler está generalmente disponible en todas las regiones en las que Amazon SageMaker Studio está disponible. Para comenzar con Amazon SageMaker Data Wrangler, consulte nuestra documentación.