Amazon SageMaker 数据标注
创建用于训练机器学习模型的高质量数据集
快速获取高质量标注数据
选择您的数据标注人力资源
提高数据标注操作的可见性
生成高质量的数据集以自定义生成式人工智能模型
Amazon SageMaker 允许您标记原始数据,例如图像、文本文件和视频,并生成标注合成数据,以创建用于训练机器学习(ML)模型的高质量数据集。SageMaker 提供两种选项,Amazon SageMaker Ground Truth Plus 和 Amazon SageMaker Ground Truth,它们让您可以灵活地运用专家团队以您的名义创建和管理数据标注工作流,或管理您自己的数据标注工作流。
Amazon SageMaker Ground Truth Plus
SageMaker Ground Truth Plus 是一项完全托管的服务,让您可以创建高质量的训练数据集,无需构建标注的应用程序或自行管理标注人力资源。SageMaker Ground Truth Plus 拥有针对机器学习任务进行过培训的专家团队,可以帮助满足您的数据安全、隐私与合规要求,同时帮助您将数据标注成本降低多达 40%。您要上传您的数据,然后 SageMaker Ground Truth Plus 会以您的名义创建和管理数据标注工作流以及人力资源。
SageMaker Ground Truth Plus 可以创建高质量的数据集来微调生成式人工智能任务(从回答问题到生成图像和视频)的根基模型。它还允许熟练的人工审查模型输出,以确保它们与人类偏好保持一致。此外,SageMaker Ground Truth Plus 使应用程序构建者能够使用其行业或公司数据自定义模型,以确保其应用程序代表他们首选的声音和风格。
Amazon SageMaker Ground Truth
如果想要灵活地构建与管理您自己的数据标注工作流和人力资源,您可以使用 Amazon SageMaker Ground Truth。SageMaker Ground Truth 是一项自助服务,可简化数据标注并通过 Amazon Mechanical Turk、第三方供应商或您自己的专门团队选择使用人工标注人员。
您还可以生成标注合成数据,而无需手动收集或标注真实世界的数据。SageMaker Ground Truth 可以以您的名义生成数十万计自动标注的合成图像。
工作原理
-
使用 SageMaker Ground Truth Plus 进行数据标注
-
使用 SageMaker Ground Truth 进行数据标注
-
生成标注合成数据
-
使用 SageMaker Ground Truth Plus 进行数据标注
-
Amazon SageMaker Ground Truth Plus 可帮助您创建高质量的训练数据集,无需构建标注应用程序或管理标注人力资源。
-
使用 SageMaker Ground Truth 进行数据标注
-
Amazon SageMaker Ground Truth 可帮助您构建与管理您自己的数据标注工作流和数据标注人力资源。
-
生成标注合成数据
-
Amazon SageMaker Ground Truth 帮助您生成标注合成数据。