El catálogo de Amazon SageMaker proporciona una clasificación automática de datos mediante agentes de IA
El catálogo de Amazon SageMaker ahora ofrece una clasificación de datos automatizada que sugiere términos de glosarios empresariales durante la publicación de los datos, lo que reduce el esfuerzo de etiquetado manual y mejora la coherencia de los metadatos en todas las organizaciones.
Esta capacidad analiza los metadatos de las tablas y la información del esquema mediante los modelos lingüísticos de Amazon Bedrock para recomendar términos relevantes de los glosarios empresariales de la organización. Los productores de datos reciben sugerencias generadas por IA para los términos empresariales definidos en sus glosarios, que incluyen tanto términos funcionales como clasificaciones de datos confidenciales, como PII y PHI, lo que facilita el etiquetado de sus conjuntos de datos con vocabulario estandarizado. Los productores pueden aceptar o modificar estas sugerencias antes de publicarlas, lo que garantiza la coherencia de la terminología en todos los activos de datos y mejora la capacidad de descubrimiento de los datos para los usuarios empresariales.
La clasificación automatizada de datos está disponible en las siguientes regiones de AWS: este de EE. UU. (norte de Virginia, Ohio), oeste de EE. UU. (Oregón), Asia Pacífico (Tokio, Seúl, Singapur, Sídney, Bombay) y Europa (Fráncfort, Irlanda, Londres, París) donde funciona
Amazon SageMaker.
Para empezar, vaya a SageMaker Unified Studio para configurar su glosario empresarial y generar recomendaciones para los términos del glosario empresarial. También puede utilizar la CLI o los SDK de AWS para gestionar mediante programación las sugerencias de términos del glosario.
Para obtener más información, consulte la guía del usuario del catálogo de SageMaker.