Amazon SageMaker 数据和人工智能治理

安全地发现、治理和协作处理数据和人工智能

概览

下一代 Amazon SageMaker 可简化湖仓、人工智能模型和应用程序中数据和人工智能的发现、治理和协作。借助基于 Amazon DataZone 构建的 Amazon SageMaker Catalog,用户可以使用生成式人工智能创建的元数据进行语义搜索,安全地发现和访问已获批准的数据和模型,也可以直接使用自然语言询问 Q 开发者版来查找数据。用户可以在 SageMaker Unified Studio(预览版)中集中使用具有精细访问控制的单一权限模型,以一致地定义和强制执行访问策略。通过轻松发布和订阅工作流程,无缝共享和协作处理数据和人工智能资产。借助 Amazon SageMaker,您可以使用 Amazon Bedrock 防护机制保护您的 AI 模型,并实施负责任的人工智能策略。通过数据质量监控和自动化、敏感数据检测以及数据和机器学习任务流水线,让整个组织安心无忧。

优势

使用基于 Amazon DataZone 构建的 Amazon SageMaker Catalog,大规模发现您的数据和人工智能资产。使用生成式人工智能增强数据发现,以便通过业务上下文自动丰富您的数据和元数据,让所有用户都能轻松查找、理解和使用数据。通过按表和列名称或业务术语表术语进行筛选,轻松共享数据、人工智能模型、提示和生成式人工智能资产。自动为每个数据集推荐有价值的列和相关的分析应用程序,确保能够使用正确的数据快速构建正确的模型。通过项目在单项体验中发布和订阅工作流程,使用无缝数据和人工智能共享,支持集中式和分散式治理模型。

通过实时查看 Amazon SageMaker 中的数据质量和数据,以及机器学习任务流水线,安心无忧。自动进行数据分析和数据质量建议,监控数据质量规则,并接收警报。使用基于规则和机器学习的方法协调实体,解决难以发现的数据质量挑战,以便您可以交付高质量的数据,从而做出自信的业务决策。使用内置的模型监控,以检测偏差或报告功能如何影响模型预测,从而提高数据管道和人工智能项目的透明度。
使用精细访问控制、数据分类和防护机制,将数据和人工智能安全集中在 Amazon SageMaker 中,以确保正确使用数据、分析和人工智能模型。只需定义一次权限,即可在数据和模型中强制执行权限。通过原生集成的 Bedrock IDE(预览版),客户可以在生成式人工智能应用程序中利用防护机制,屏蔽有害内容、过滤幻觉以及启用可自定义的隐私、安全和准确性保护措施。使用 AWS Comprehend 自动识别管道中的敏感信息。
通过数据使用与模型日志记录和监控,满足审计和监管合规要求。通过基于项目的隔离,支持在整个企业中合理使用分析和人工智能资产。了解整个湖仓的数据和模型使用情况,以增强安全性。使用 Amazon SageMaker Clarify 监控模型的偏差、准确性和稳健性,使之符合负责任的人工智能标准。将成本与业务计划保持一致,并提供清晰的业务投资视图。

功能

针对环境和可查找性的精选数据

该目录为您的技术元数据提供业务背景,让您能够利用业务背景对元数据进行丰富。您可以开放具有业务环境的数据的可见性,让所有用户都能快速而轻松地查找、理解和信任数据。

自动推荐元数据

自动将业务描述和名称添加到数据中,这有助于您轻松理解环境,并免于应对晦涩的技术名称。该自动化功能由大型语言模型(LLM)驱动,可提高准确性和一致性。

为您的所有应用程序提供一致的 AI 安全级别

Amazon Bedrock 防护机制可根据特定使用案例的策略,帮助评估用户输入和 FM 响应,无论底层基础模型如何,均提供额外的保障措施。

快速审计和跟踪模型

通过统一视图,快速审核所有模型、端点和模型监控工作的性能并排除故障。通过自动警报跟踪预期模型行为的偏差,以及缺失或无效的监控作业。

数据质量

借助数据质量统计数据,数据使用者可以查看来自 AWS 或第三方系统的数据质量指标。数据使用者可以信任他们用于决策的数据来源,并在搜索资产时了解数据质量背景。数据生产者和 IT 团队还可以使用 API,将来自第三方系统的数据质量统计数据整合到控制台之外的统一门户中。

数据和机器学习任务流水线

了解数据和模型的历时变化。任务流水线可以帮助数据使用者了解数据的来源、变化方式及其使用情况,从而提高信任度和组织的数据和人工智能素养。您可以减少映射数据和人工智能资产及其关系、排除故障和开发管线以及维护数据和人工智能治理实践所花费的时间。