Amazon SageMaker Ground Truth

轻松大规模标记用于机器学习的训练数据

Amazon SageMaker Ground Truth 是一种完全托管的数据标记服务,可让您轻松构建高度准确的训练数据集以用于机器学习。通过 SageMaker Ground Truth 控制台,您可以使用自定义或内置数据标记工作流,在几分钟内开始标记数据。这些工作流支持各种使用案例,包括 3D 点云、视频、图像和文本。在这些工作流中,标记员可以使用辅助标记功能(如自动捕捉 3D 立方体、去除 2D 图像中的失真和自动分割工具),从而缩短标记数据集所需的时间。此外,Ground Truth 还提供了使用机器学习模型来标记数据的自动数据标记功能。

工作原理

Amazon SageMaker Ground Truth 工作原理

优势

更准确地标记数据

SageMaker Ground Truth 可以通过注释整合和审计工作流来提高标签的质量。注释整合是收集两个或更多数据标记员输入的标签数据,并合并这些数据来为机器学习模型创建单个数据标签的过程。在内置审计和审核工作流中,工作人员可以执行标签验证并进行调整,以提高准确性。

易于使用

SageMaker Ground Truth 通过直观的用户界面提供自动标记功能,如“自动分割”、“自动捕捉 3D 立方体”和“传感器与 2D 视频帧融合”,以缩短数据标记任务所需的时间,同时提高质量。 对于语义分割,工作人员必须标记图像中的对象。使用自动分割功能,工作人员通过 4 次而不是数百次单击即可捕获对象。

将成本降低高达 70%

SageMaker Ground Truth 提供自动数据标记功能。在使用主动学习模型的情况下,数据会被标记,而且只有在该模型无法妥善标记数据时,数据才会被路由给标记员。然后,人工标记的数据会被用于训练机器学习模型,以提高其准确性。因此,在下一轮标记中,发送给标记员的数据就会减少,从而将数据标记成本降低高达 70%。

选择您的队伍

SageMaker Ground Truth 支持您与组织内外的标记员合作。使用 SageMaker Ground Truth,您可以轻松地为自己的标记员发送标记任务,还可以接触到超过 500,000 名独立承包商的队伍,这些承包商已在通过 Amazon Mechanical Turk 执行机器学习相关任务。 如果您的数据需要保密或要求工作人员具备特殊技能,您可以使用经过 AWS 预先筛选的供应商来执行质量和安全程序,包括 iVision、CapeStart Inc.、Cogito 和 iMerit。

Amazon SageMaker Ground Truth