Saltar al contenido principal

Catálogo de Amazon SageMaker

Descubra, gobierne y colabore en datos e inteligencia artificial de forma segura

Información general

La próxima generación de Amazon SageMaker ofrece una forma más sencilla de descubrir, gobernar y colaborar en datos e inteligencia artificial, y abarca tanto datos estructurados como no estructurados, modelos de IA, paneles de inteligencia empresarial y aplicaciones. Con el Catálogo de Amazon SageMaker, puede descubrir y acceder de forma segura a datos y modelos aprobados mediante búsqueda semántica con metadatos generados por IA generativa, o simplemente consultar a Amazon Q Developer en lenguaje natural para encontrar datos. Los usuarios pueden definir y aplicar políticas de acceso de manera coherente a través de un modelo unificado de permisos, con controles de acceso detallados administrados de forma centralizada en Amazon SageMaker Unified Studio. Comparta y colabore fácilmente en datos y activos de IA a través de flujos de trabajo simples de publicación y suscripción. Fortalezca la confianza en toda la organización con soluciones que permiten supervisar la calidad de los datos y clasificarlos, así como seguir el rastro tanto de los datos como de los modelos de machine learning (ML).

Consulte el catálogo de Amazon SageMaker en acción

Missing alt text value

Beneficios

Descubra los datos y activos de IA a escala con el Catálogo de SageMaker, creado en Amazon Datazone. Mejore el descubrimiento de datos con IA generativa que enriquece automáticamente los datos y metadatos con contexto empresarial, lo que facilita a todos los usuarios la búsqueda, comprensión y uso de los datos. Comparta los datos, modelos de IA, peticiones y activos de IA generativa con filtros por nombres de tablas, columnas o términos de glosarios empresariales. Recomiende automáticamente las columnas valiosas y las aplicaciones de análisis relevantes para cada conjunto de datos, lo que permite utilizar los datos adecuados para crear rápidamente los modelos correctos. Admita modelos de gobernanza centralizados y descentralizados mediante el intercambio fluido de datos e inteligencia artificial a través de flujos de trabajo de publicación y suscripción, todo dentro de una experiencia unificada mediante Proyectos.
Inspire confianza con visibilidad en tiempo real sobre la calidad de los datos, así como sobre el linaje de datos y modelos de machine learning en SageMaker. Automatice la generación de perfiles de datos y las recomendaciones sobre su calidad, supervise las reglas de calidad y reciba alertas. Resuelva problemas de calidad de datos difíciles de detectar mediante enfoques basados en reglas y machine learning para conciliar entidades, y así garantizar datos de alta calidad que respalden decisiones empresariales con confianza. Fomente la transparencia en las canalizaciones de datos y los proyectos de IA mediante la supervisión integrada de modelos, lo que permite detectar sesgos y comprender cómo cada característica influye en las predicciones del modelo.
Centralice la seguridad de los datos y la IA en SageMaker mediante controles de acceso detallados, clasificación de datos y barreras de protección, a fin de garantizar el uso adecuado de los datos, los análisis y los modelos de IA. Defina los permisos una sola vez y aplíquelos en los datos y modelos. Con Amazon Bedrock integrado de forma nativa, los clientes pueden aplicar las barreras de protección de Amazon Bedrock en aplicaciones de IA generativa para bloquear contenido perjudicial, filtrar alucinaciones y habilitar protecciones personalizables en materia de privacidad, seguridad y precisión. Identifique automáticamente información confidencial dentro de las canalizaciones mediante Amazon Comprehend.
Cumpla con los requisitos normativos y de auditoría mediante el control del uso de datos y el registro y la supervisión de modelos. Fomente el uso adecuado de los activos de análisis e IA en la organización mediante un aislamiento basado en proyectos. Comprenda cómo se utilizan los datos y los modelos en el lake house para fortalecer la seguridad. Utilice Amazon SageMaker Clarify para supervisar el sesgo, la precisión y la solidez de los modelos, y asegurarse de que cumplan con los estándares de IA responsable. Alinee los costos con las iniciativas empresariales y tenga una visión clara de las inversiones empresariales.

Características

Datos seleccionados para crear contexto y facilitar la búsqueda

El catálogo de SageMaker incorpora el contexto empresarial a los metadatos técnicos y permite enriquecerlos con ese mismo contexto. Puede hacer que los datos sean visibles dentro de un contexto empresarial, lo que permite a todos los usuarios encontrarlos, comprenderlos y confiar en ellos de forma rápida y sencilla.

Recomendaciones de metadatos automatizadas

Automatice la incorporación de nombres y descripciones empresariales a los datos, lo que facilita la comprensión del contexto y evita tener que enfrentarse a nombres técnicos crípticos. Esta automatización se basa en modelos de lenguaje de gran tamaño (LLM) para mejorar la precisión y la coherencia.

Ofrezca un nivel uniforme de seguridad en materia de IA en todas las aplicaciones.

Las barreras de protección de Amazon Bedrock ayudan a evaluar las entradas de los usuarios y las respuestas de los modelos fundacionales (FM) según políticas específicas para cada caso de uso, y ofrecen una capa adicional de protección independientemente de los FM subyacentes.

Audite y realice un seguimiento rápido de los modelos

Audite rápidamente y diagnostique problemas de rendimiento en todos los modelos, puntos de conexión y trabajos de supervisión de modelos a través de una vista unificada. Supervise las desviaciones respecto del comportamiento esperado del modelo, así como los trabajos de supervisión inactivos o ausentes, mediante alertas automatizadas.

Calidad de los datos

Gracias a las estadísticas de calidad de los datos, los consumidores pueden consultar métricas de calidad provenientes de sistemas de AWS o de terceros. Los consumidores de datos pueden confiar en los orígenes que utilizan para tomar decisiones y contar con contexto sobre la calidad de los datos mientras buscan activos. Los productores de datos y los equipos de TI también pueden usar las API para incorporar estadísticas de calidad de los datos provenientes de sistemas de terceros en un portal unificado fuera de la consola.

Linaje de datos y ML

Comprenda el movimiento de los datos y los modelos a lo largo del tiempo. El linaje puede aumentar tanto la confianza como el nivel de comprensión de los datos y la inteligencia artificial en una organización, ya que ayuda a los consumidores de datos a entender su origen, los cambios que ha sufrido y cómo se ha utilizado. Puede reducir el tiempo dedicado a mapear datos y activos de IA y sus relaciones, resolver problemas, desarrollar canalizaciones y consolidar las prácticas de gobernanza de datos e IA.

Clientes

Natera, Inc.

“Al integrar Amazon QuickSight con Amazon SageMaker, nuestros equipos de operaciones de laboratorio y científicos ahora pueden supervisar el rendimiento de las pruebas clínicas en todos los sitios en tiempo real. Hemos desarrollado paneles unificados que consolidan el rendimiento, las métricas de control de calidad y los tiempos de entrega, lo que permite un análisis detallado de las tendencias y una optimización continua del rendimiento. Los científicos ahora pueden realizar análisis de datos exhaustivos, desde la revisión exploratoria hasta el desarrollo de modelos, todo dentro de un entorno único e integrado”.

Mirko Buholzer, vicepresidente de ingeniería de software de Natera, Inc.

Cómo Natera escala la genómica con el catálogo de Amazon SageMaker

Cisco

“Quiere descubrir, compartir y gobernar sus datos. Ya los llame malla de datos o tejido de datos, lo cierto es que los datos se encuentran distribuidos entre distintos equipos y silos, y necesita una forma de unificarlos. El catálogo de Amazon SageMaker conecta a los productores y consumidores de datos, lo que permite a los productores compartir datos con controles y contratos de datos integrados, y a los consumidores acceder a esos datos con las herramientas de su elección”

Shaja Arul Selvamani, director sénior de IA y ML de Cisco

The Cisco logo featuring the company's name in blue with a stylized bridge design above it.

NatWest

“Nuestro equipo de ingeniería de plataformas de datos ha implementado varias herramientas para usuarios finales destinadas a tareas de ingeniería de datos, machine learning, SQL e IA generativa. A medida que buscamos simplificar los procesos en el banco, nos hemos enfocado en optimizar la autenticación de los usuarios y la autorización de acceso a los datos. Amazon SageMaker ofrece una experiencia de usuario lista para usar que nos ayuda a implementar un entorno unificado en la organización, lo que reduce en aproximadamente un 50 % el tiempo que nuestros usuarios de datos necesitan para acceder a nuevas herramientas”.

Zachery Anderson, director de datos y análisis de NatWest Group

Missing alt text value