发布于: Sep 22, 2020

现在,您可以使用 Amazon Sagemaker GroundTruth 的训练数据集在 Amazon Comprehend 中训练自定义命名实体识别和自定义分类模型。您可以使用 Comprehend 的自定义命名实体识别来识别特定于您所在行业或组织的术语。例如,您可以从文本数据中即时提取产品名称、财务实体或与您有关的任何术语。同样,您可以使用 Comprehend 的自定义分类将与您的用例相关的类别分配给文本数据。

Amazon Comprehend 是一项自然语言处理 (NLP) 服务,可通过机器学习发现文本中的见解和关系。它提供预训练模型来识别文档中的实体、关键短语、情绪和其他常见元素。您还可以使用 Amazon Comprehend 构建自定义模型,以识别自定义实体和对文档进行分类。

Amazon SageMaker Ground Truth 可帮助您快速构建用于自定义 Comprehend 模型的高准确度培训数据集。使用 SageMaker Ground Truth,您可以轻松地为自己的标记员发送标记任务,还可以接触到超过 500000 名独立承包商的队伍,这些承包商已在通过 Amazon Mechanical Turk 执行机器学习相关任务。如果您的数据需要保密或要求工作人员具备特殊技能,您可以使用经过 AWS 预先筛选的供应商来执行质量和安全程序,包括 iVision、CapeStart Inc.、Cogito 和 iMerit。使用 AutoML,Comprehend 将从训练数据集中学习,然后训练私有、自定义模型。无需具备机器学习经验。

Amazon Comprehend 对 Sagemaker GroundTruth 的支持现已在提供 Amazon Comprehend 的所有 AWS 区域中推出。要试用这一新功能,请登录 Amazon Comprehend 控制台以获得无代码体验,或下载 AWS 开发工具包。