跳至主要内容

Amazon SageMaker AI

使用 Amazon SageMaker AI 和 MLflow,加速生成式人工智能开发

无需管理基础设施,即可跟踪实验、评估模型和跟踪人工智能应用程序

为什么要使用 Amazon SageMaker AI with MLflow?

构建和自定义人工智能模型是一个迭代过程,需要运行数百次训练,以便找到最佳算法、架构和参数,从而实现最高的模型准确性。Amazon SageMaker AI 提供了一项托管式、无服务器 MLflow 功能,能够让人工智能开发人员无需管理任何基础设施,即可轻松跟踪实验、观察行为以及评估人工智能模型和应用程序的性能。SageMaker AI with MLflow 还集成了一些常用的 SageMaker AI 模型开发工具,例如 SageMaker AI JumpStart、模型注册表、管道和无服务器模型自定义功能,可帮助您连接人工智能生命周期中从实验到部署的每一个步骤。

Amazon SageMaker AI with MLflow 的优势

无需预置基础设施,也无需配置跟踪服务器,即可开始跟踪实验和人工智能应用程序。人工智能开发人员可以即时访问一项无服务器 MLflow 功能,它能够让您的团队专注于构建人工智能应用程序,而不是管理基础设施。

无论您是运行单个实验还是管理数百个并行微调作业,SageMaker AI with MLflow 都会自动扩展,以便满足您的需求。MLflow 可以在密集的实验突发期间调整您的基础设施,而且不必手动干预即可在平静期缩减规模,从而保持稳定的性能,而无需承担管理服务器的运营负担。

通过单一界面,您可以查看正在进行的训练作业、在实验期间与团队成员协作,并对每个模型和应用程序维持版本控制。MLflow 还提供了一些高级跟踪功能,可帮助您快速识别错误或意外行为的来源。

随着 MLflow 项目的发展,SageMaker AI 客户将继续受益于开源社区创新,同时享受 AWS 的无服务器支持。

Amazon SageMaker AI with MLflow 可自动升级到最新版本的 MLFlow,这样一来,您无需使用维护时段或进行迁移,即可访问最新的特性和功能。

简化人工智能模型自定义

借助 SageMaker AI 上的 MLFlow,您可以跟踪、安排和比较实验,以便确定性能最佳的模型。MLflow 集成了适用于 Amazon Nova、Llama、Qwen、DeepSeek 和 GPT-OSS 等热门模型的 Amazon SageMaker AI 无服务器模型自定义功能,因此,您可以通过单一界面来查看正在进行的训练任务和评估。 

Missing alt text value

通过即时管理来保持一致性

您可以使用 MLflow 提示注册表来简化人工智能应用程序中的提示工程和管理。MLflow 提示注册表是一项强大的功能,能够让您在整个组织中对提示进行版本控制、跟踪和重复使用,有助于在即时开发过程中保持一致性和改善协作。

Missing alt text value

实时跟踪人工智能应用程序和代理

SageMaker AI with MLflow 会在人工智能开发过程中的每一步记录输入、输出和元数据,以便快速识别错误或意外行为。借助面向代理式工作流和多步骤应用程序的高级跟踪功能,您将获得所需的可见性,因此能够调试复杂的生成式人工智能系统并优化它们的性能。 

Missing alt text value

利用 SageMaker 模型注册表来集中治理模型

各个组织需要采用一种简单的方法,在多个开发团队中跟踪每一个候选模型,以便明智地决定要继续将哪些模型投放到生产环境中。托管式 MLflow 包含专门构建的集成,可自动将 MLflow 中注册的模型与 SageMaker 模型注册表同步。这一集成能够让人工智能模型开发团队使用不同的工具来完成各自的任务:使用 MLflow 进行实验,并使用 SageMaker 模型注册表通过全面的模型沿袭来管理生产生命周期。 

Missing alt text value

将模型无缝部署到 SageMaker AI 端点

实现所需的模型准确性和性能目标之后,只需在 SageMaker AI 推理端点中点击几下,即可将模型从 SageMaker 模型注册表部署到生产环境中。这一无缝集成无需构建用于存储模型的定制容器,还能够让客户使用经过优化的 SageMaker AI 推理容器,同时保留 MLflow 在记录和注册模型方面的人性化体验。

Missing alt text value

野生动物保护协会

“WCS(野生动物保护协会)正在通过 MERMAID 推动全球的珊瑚礁保护工作,MERMAID 是一个开源平台,利用机器学习模型来分析世界各地的科学家们提供的珊瑚礁照片。当我们的基础设施需求发生变化时,Amazon SageMaker with MLflow 无需配置 MLflow 跟踪服务器或者管理容量,这样就提高了我们的工作效率。通过让我们的团队能够全身心地专注于模型创新,我们正在缩短部署时间,以便为海洋科学家和管理人员提供关键的云驱动型洞察。”

Kim Fisher,
WCS MERMAID 首席软件工程师

Missing alt text value