Amazon SageMaker 数据标注

创建用于训练机器学习模型的高质量数据集

快速获取高质量标注数据

选择您的数据标注人力资源

提高数据标注操作的可见性

生成高质量的数据集以自定义生成式人工智能模型

Amazon SageMaker 允许您标记原始数据,例如图像、文本文件和视频,并生成标注合成数据,以创建用于训练机器学习(ML)模型的高质量数据集。SageMaker 提供两种选项,Amazon SageMaker Ground Truth Plus 和 Amazon SageMaker Ground Truth,它们让您可以灵活地运用专家团队以您的名义创建和管理数据标注工作流,或管理您自己的数据标注工作流。

Amazon SageMaker Ground Truth Plus

SageMaker Ground Truth Plus 是一项完全托管的服务,让您可以创建高质量的训练数据集,无需构建标注的应用程序或自行管理标注人力资源。SageMaker Ground Truth Plus 拥有针对机器学习任务进行过培训的专家团队,可以帮助满足您的数据安全、隐私与合规要求,同时帮助您将数据标注成本降低多达 40%。您要上传您的数据,然后 SageMaker Ground Truth Plus 会以您的名义创建和管理数据标注工作流以及人力资源。

SageMaker Ground Truth Plus 可以创建高质量的数据集来微调生成式人工智能任务(从回答问题到生成图像和视频)的根基模型。它还允许熟练的人工审查模型输出,以确保它们与人类偏好保持一致。此外,SageMaker Ground Truth Plus 使应用程序构建者能够使用其行业或公司数据自定义模型,以确保其应用程序代表他们首选的声音和风格。

Amazon SageMaker Ground Truth

如果想要灵活地构建与管理您自己的数据标注工作流和人力资源,您可以使用 Amazon SageMaker Ground Truth。SageMaker Ground Truth 是一项自助服务,可简化数据标注并通过 Amazon Mechanical Turk、第三方供应商或您自己的专门团队选择使用人工标注人员。

您还可以生成标注合成数据,而无需手动收集或标注真实世界的数据。SageMaker Ground Truth 可以以您的名义生成数十万计自动标注的合成图像。

工作原理

  • 使用 SageMaker Ground Truth Plus 进行数据标注
  • Amazon SageMaker Ground Truth Plus 可帮助您创建高质量的训练数据集,无需构建标注应用程序或管理标注人力资源。

    Amazon SageMaker Ground Truth Plus 工作原理
  • 使用 SageMaker Ground Truth 进行数据标注
  • Amazon SageMaker Ground Truth 可帮助您构建与管理您自己的数据标注工作流和数据标注人力资源。

    Amazon SageMaker Ground Truth 工作原理
  • 生成标注合成数据
  • Amazon SageMaker Ground Truth 帮助您生成标注合成数据。

    生成标注合成数据

使用案例

支持生成式人工智能应用程序

创建高质量的数据集以微调和自定义根基模型。

了解有关生成式人工智能的更多信息 »

自然语言处理

使用特定标签对文本进行分类或标记命名实体(NER)以生成训练数据集。

了解有关自然语言处理的信息 »

计算机视觉

对图像和视频进行分类,进行语义分割以实现高度详细的对象识别,并使用一整套图像和视频注释工具来检测和跟踪对象。

了解有关计算机视觉的更多信息 »

3D LIDAR 导航

检测和跟踪对象,并执行语义分割,以便在 LIDAR 3D 点云数据中实现高度详细的对象识别。

了解有关 3D LIDAR 导航的更多信息 »

如何开始

开始使用数据标注

使用 SageMaker Ground Truth 设置自己的标注工作流程。

通过教程了解操作方法 »

访问数据标注工作人员

将您的标注操作移交给 AWS。

联系我们的团队 »

了解有关 SageMaker Ground Truth 的更多信息

访问其他资源、文档和学习材料。

访问入门 »