发布于: Dec 1, 2021

今天,我们很高兴宣布 Amazon SageMaker Ground Truth Plus 的全面上市,这是一项全新的交钥匙数据标注服务,使您能够快速创建高质量的训练数据集,并将成本降低 40%。

要训练机器学习(ML)模型,数据科学家需要大型、高质量且标注的数据库。随着机器学习(ML)采用的增长,标注需求也在增加。这迫使数据科学家花费数周时间来构建数据标注工作流和管理数据标注人力队伍。遗憾的是,这样会导致延迟革新的步伐,同时也增加了成本。为了确保数据科学家能够花时间构建、培训和部署机器学习(ML)模型,数据科学家通常会让其他由数据运营经理和项目经理组成的内部团队制作高质量的培训数据集。然而,这些团队通常无法获得交付高质量训练数据集所需的技能,这影响了机器学习(ML)结果。如果您可以依赖交钥匙服务,在不消耗内部资源的情况下大规模创建高质量的培训数据集,会怎么样? 输入 Amazon SageMaker Ground Truth Plus。

Amazon SageMaker Ground Truth Plus 通过消除与构建数据标注应用程序和管理标注人力相关的无差别繁重工作,使数据科学家以及业务经理(如数据运营经理和项目经理)能够轻松创建高质量的培训数据集。您所做的只是共享数据以及标注要求,而 Ground Truth Plus 会根据这些要求设置和管理您的数据标注工作流。在那里,受过各种机器学习(ML)任务训练的专家团队执行数据标注。您无需具备高深的机器学习(ML)专家级能力或工作流设计和质量管理的知识就能使用 Ground Truth Plus。

Ground Truth Plus 使用机器学习(ML)技术,包括主动学习、预标注和机器验证。这样可以提高输出数据集的质量,并降低了数据标注成本。Ground Truth Plus 提供对数据标注运营和质量管理的透明度。您可以借此跨多个项目查看训练数据集的进度,跟踪项目指标,如每日吞吐量,检查标注的质量,并提供关于标签数据的反馈。Ground Truth Plus 可以用于多个使用案例,包括计算机视觉、自然语言处理和语音识别。

Amazon SageMaker Ground Truth Plus 一般在美国东部(弗吉尼亚北部)AWS 区域中可用。如需了解有关 Amazon SageMaker Ground Truth Plus 的更多信息,您可以阅读博客文章,参阅 Ground Truth Plus 文档以及访问 SageMaker 数据标注网页Ground Truth Plus 控制台,以便顺利入门。