Publicado en: May 1, 2023
Amazon SageMaker Data Wrangler reduce, de semanas a minutos, el tiempo que se tarda en agregar y preparar datos para machine learning (ML). Con SageMaker Data Wrangler, es posible simplificar el proceso de preparación de datos e ingeniería de características, así como completar cada paso del flujo de trabajo de preparación de datos, incluida la selección, la exploración, la limpieza y el procesamiento de los datos, desde una única interfaz visual.
A partir de hoy, puede utilizar las nuevas capacidades de Amazon SageMaker Data Wrangler para preparar los datos de las imágenes para el etiquetado, el entrenamiento o la inferencia. Puede obtener una vista previa e importar imágenes desde Amazon S3 y utilizar una variedad de transformaciones de imágenes integradas para limpiar, estandarizar y mejorar la calidad de sus datos de imágenes. Estas transformaciones integradas incluyen el dimencionamiento, la eliminación de duplicados, la rotación, el giro, la escala de grises, la mejora del contraste, el desenfoque y la adición de ruido, etc. Data Wrangler también admite casos de uso avanzados, como la detección de valores atípicos o la extracción de textos de imágenes mediante código personalizado y fragmentos de código integrados. Estos fragmentos de código incluyen ejemplos de cómo utilizar un modelo previamente entrenado con Amazon Sagemaker Jumpstart para realizar análisis o transformaciones avanzados mediante una llamada a un punto de conexión del modelo previamente implementado. Tras crear una receta con los datos de la imagen muestreada en el modo interactivo, puede crear un trabajo de PySpark a través de la interfaz visual para escalar el procesamiento de todas las imágenes de su conjunto de datos.
Data Wrangler admite la preparación de datos de imágenes en todas las regiones que actualmente admiten Data Wrangler. Para obtener más información, consulte esta publicación del blog y la documentación técnica de AWS.