Publicado en: Aug 29, 2022
Amazon SageMaker Data Wrangler ayuda a reducir de semanas a minutos el tiempo que se tarda en agregar y preparar datos para machine learning (ML) en Amazon SageMaker Studio, el primer entorno de desarrollo completamente integrado para ML. Con SageMaker Data Wrangler, podrá simplificar el proceso de preparación de datos e ingeniería de características, y podrá completar cada paso del flujo de trabajo de preparación de datos, incluida la selección, limpieza, exploración y visualización de datos en una única interfaz visual. Los clientes que utilizan Data Wrangler pueden importar datos desde Amazon S3, Amazon Athena, Amazon Redshift, Snowflake, la plataforma de Databricks Lakehouse y otros servicios que aún no se presentaron.
A partir de hoy, los clientes nuevos de Data Wrangler pueden comenzar a utilizar Data Wrangler más rápidamente usando un conjunto de datos de muestra y siguiendo los pasos de guía para explorar el producto por primera vez. Data Wrangler ofrece el conjunto público de datos Titanic, muy utilizado para enseñar y experimentar con machine learning; así, el cliente ya no necesita importar sus propios datos para comenzar. Ahora, Data Wrangler sugiere acciones para ayudar a los usuarios a detectar las características clave, como el análisis de información y calidad de los datos, una reconocida herramienta que comprueba la calidad de los datos y ayuda a detectar las anomalías de los datos.
Para obtener más información sobre cómo comenzar a usar Amazon SageMaker Data Wrangler, consulte el blog o la documentación de AWS.