亚马逊AWS官方博客
使用 Amazon SageMaker Ground Truth 执行语义分割添加标签时自动分割对象
Amazon SageMaker Ground Truth 可帮助您快速构建高度准确的机器学习 (ML) 训练数据集。利用 Ground Truth,可以方便地找到您自己的人工标记工作者,并为他们提供用于常见添加标签任务的内置工作流和界面。此外,Ground Truth 还可以使用自动添加标签功能将添加标签的成本降低多达 70%,其中自动添加标签的工作原理是利用人工添加标签的数据来训练 Ground Truth,从而使这项服务学会独立为数据加标签。
语义分割是一项机器学习中计算机视觉技术, 其中包括为图像中的单独像素分配类标签。例如,在由移动车辆捕获的视频帧中,类标签可以包括车辆、行人、道路、交通信号灯、建筑物或背景。它可以让您高度准确地了解图像中不同对象的位置,因此常用于为自动驾驶汽车或机器人构建感知系统。若要为语义分割系统构建机器学习模型,则首先必须在像素级别为大量数据添加标签。这个过程非常复杂,它需要大量技能熟练的添加标签的人员和时间,有些图像可能需要长达 2 个小时才能准确完成标签添加。
为了提高添加标签的工作效率,提高准确度并减轻添加标签人员的负载,Ground Truth 在语义分割打标签的用户界面中新增了自动分割功能。利用自动分割工具,只需少量输入即可对图像中您感兴趣的区域自动添加标签,从而简化您的任务。您可以接受、撤销或纠正自动分割功能的输出。以下屏幕截图展示了工具栏中的自动分割功能,它将捕获的图像中的狗作为一个对象。分配给狗的标签为Bubbles。
借助这一新功能,您的语义分割任务的工作效率可以提高十倍。您只需绘制四个点:分别为对象的顶部、底部、最左侧和最右侧,而无需绘制紧密贴合的多边形或使用画笔工具捕获图像中的对象。Ground Truth 会将这四个点当作输入,并使用 Deep Extreme Cut (DEXTR) 算法在对象周围生成紧密结合的 mask。以下演示介绍了该工具如何加快复杂添加标签任务的吞吐量(视频以 5 倍实时速度播放)。
小结
本博文演示了被称为语义分割的机器学习计算机视觉技术的作用和复杂性。利用自动分割功能,只需添加标签的工作人员进行少量输入即可对图像中您感兴趣的区域执行自动分割,从而加速语义分割添加标签任务。