Publicado en: Apr 17, 2024
Los cuadernos de JupyterLab de Amazon SageMaker Studio ahora vienen con una extensión de SQL integrada con la que los científicos de datos pueden descubrir, explorar y transformar sin problemas datos de varios orígenes de datos mediante SQL y Python directamente desde los cuadernos.
Los científicos de datos que trabajan en los cuadernos de Studio ahora pueden conectarse sin problemas a los servicios de datos más populares, como Amazon Athena, Amazon Redshift y Snowflake, a través de las conexiones de AWS Glue. Los administradores pueden administrar estas conexiones de forma segura, lo que permite a los científicos de datos acceder a los datos autorizados sin necesidad de administrar las credenciales manualmente. Una vez conectados a un origen de datos, los científicos de datos pueden explorar y buscar fácilmente bases de datos, esquemas, tablas y vistas, y pueden obtener una vista previa de los datos en la interfaz del cuaderno. Luego, pueden mezclar código SQL y Python en el mismo cuaderno para explorar y transformar datos de manera eficiente para usarlos en proyectos de machine learning. Las características adicionales, como la finalización de comandos SQL, la asistencia para formatear el código y el resaltado de la sintaxis, ayudan a acelerar el desarrollo del código y a mejorar la productividad general de los desarrolladores. Al integrar los servicios de datos populares, la exploración de datos de SQL/Python y machine learning de extremo a extremo en una interfaz de usuario unificada, SageMaker Studio reduce la necesidad de que los científicos de datos cambien de herramienta mientras trabajan en tareas de análisis y machine learning, lo que se implica un importante ahorro de tiempo y un aumento de la productividad.
Esta característica se encuentra disponible en todas las regiones de AWS comerciales en las que está disponible SageMaker Studio.
Para obtener más información, consulte este blog y la guía para desarrolladores de SageMaker.