通过 Amazon Comprehend 使用更少的训练文档训练自定义的实体识别模型

发布于: Aug 9, 2021

Amazon Comprehend 是一种自然语言处理（NLP）服务，它使用机器学习来分析文本文档并获取文本中的情绪、实体和主题之类的洞察。我们今天更新了自定义实体识别模型，从而让您能够使用更少的训练文档来训练模型。自定实体识别功能扩展了 Amazon Comprehend 的功能，让您可以非作为预设通用实体类型而受到支持的新实体类型。这意味着除可以识别来自检测实体 API（例如 LOCATION 或 DATE、PERSON）的实体类型外，您还可以分析文档并提取实体（例如 PRODUCT_CODE、EMPLOYEE_ID、CONTRACTOR_NAME）或者您定义的适合您具体需求的业务特定实体。从今天开始，我们将需要的最小训练文档数量减少了 50%。这意味着您可以用低至 250 个文档，每个实体类型 100 个标注来训练自定义模型。如果训练更多的文档，甚至可以用比以前更新的模型获得更佳的结果！

更新后的自定义实体识别模型已在所有提供 Amazon Comprehend 的 AWS 区域开放。要试用此新功能，请登录 Amazon Comprehend 控制台以获得无代码体验，或下载 AWS 软件开发工具包。您也可以阅读我们的博客，以详细了解这项新功能。

通过 Amazon Comprehend 使用更少的训练文档训练自定义的实体识别模型

终止对 Internet Explorer 的支持