Publicado en: Dec 16, 2022

Hoy, el almacén de características de Amazon SageMaker anuncia la compatibilidad con el SDK de Python de SageMaker para su tienda offline. El almacén de características de Amazon SageMaker es un repositorio completamente administrado y creado específicamente para almacenar, actualizar, buscar y compartir características de machine learning (ML). La tienda offline del almacén de características de SageMaker cuenta con características de ML históricas, y puede utilizarlo para generar conjuntos de datos de entrenamiento para la formación y la inferencia por lotes. Hasta el momento, tenía que usar Athena y Glue, y escribir consultas SQL ad hoc para crear estos conjuntos de datos de entrenamiento. 

Con esta versión, puede usar los métodos del SDK de Python para crear conjuntos de datos de entrenamiento. El SDK se puede usar para leer los datos en un marco de datos o para exportarlos en formato csv. En lugar de escribir consultas SQL complejas, puede utilizar estos métodos para casos de uso comunes en tiendas offline, como unirse a grupos de características, viajar en el tiempo, crear uniones precisas en un punto en el tiempo y filtrar registros duplicados de los conjuntos de datos de entrenamiento.

Para obtener más información, consulte la documentación aquí. Para comenzar, inicie sesión en la consola de Amazon SageMaker