Amazon SageMaker Ground Truth

轻松大规模标记用于机器学习的训练数据

Amazon SageMaker Ground Truth 是一种完全托管的数据标记服务,可让您轻松构建高度准确的训练数据集以用于机器学习。通过 SageMaker Ground Truth 控制台,您可以使用自定义或内置数据标记工作流,在几分钟内开始标记数据。这些工作流支持各种使用案例,包括 3D 点云、视频、图像和文本。在这些工作流中,标记员可以使用辅助标记功能(如自动捕捉 3D 立方体、去除 2D 图像中的失真和自动分割工具),从而缩短标记数据集所需的时间。此外,Ground Truth 还提供了使用机器学习模型来标记数据的自动数据标记功能。

优势

更准确地标记数据

SageMaker Ground Truth 可以通过注释整合和审计工作流来提高标签的质量。注释整合是收集两个或更多数据标记员输入的标签数据,并合并这些数据来为机器学习模型创建单个数据标签的过程。在内置审计和审核工作流中,工作人员可以执行标签验证并进行调整,以提高准确性。

易于使用

SageMaker Ground Truth 通过直观的用户界面提供自动标记功能,如“自动分割”、“自动捕捉 3D 立方体”和“传感器与 2D 视频帧融合”,以缩短数据标记任务所需的时间,同时提高质量。 对于语义分割,工作人员必须标记图像中的对象。使用自动分割功能,工作人员通过 4 次而不是数百次单击即可捕获对象。

将成本降低高达 70%

SageMaker Ground Truth 提供自动数据标记功能。在使用主动学习模型的情况下,数据会被标记,而且只有在该模型无法妥善标记数据时,数据才会被路由给标记员。然后,人工标记的数据会被用于训练机器学习模型,以提高其准确性。因此,在下一轮标记中,发送给标记员的数据就会减少,从而将数据标记成本降低高达 70%。

选择您的队伍

SageMaker Ground Truth 支持您与组织内外的标记员合作。使用 SageMaker Ground Truth,您可以轻松地为自己的标记员发送标记任务,还可以接触到超过 500,000 名独立承包商的队伍,这些承包商已在通过 Amazon Mechanical Turk 执行机器学习相关任务。 如果您的数据需要保密或要求工作人员具备特殊技能,您可以使用经过 AWS 预先筛选的供应商来执行质量和安全程序,包括 iVision、CapeStart Inc.、Cogito 和 iMerit。

工作原理

Amazon Sagemaker Ground Truth 工作原理
Amazon SageMaker Ground Truth 教程
立即观看教程

了解如何使用 Amazon SageMaker Ground Truth 为图像分类使用案例构建高度准确的训练数据集。

注册免费 AWS 账户
注册免费账户

立即享受 AWS 免费套餐。 

开始在控制台中构建
开始在控制台中构建

开始使用 Amazon SageMaker Ground Truth 在 AWS 管理控制台中构建。