发布于: Aug 3, 2022

Amazon Comprehend 通过减少模型训练的注释要求,让客户更容易开始使用自定义实体识别。Amazon Comprehend 是一项自然语言处理 (NLP) 服务,提供可从文本中提取关键短语、上下文实体、事件和情感的 API。实体指的是文档中的要素,如人员、地点、组织、信用卡号码等。只需几个简单的步骤,Amazon Comprehend 中的自定义实体识别 (CER) 就可以使用事务特有的实体来训练模型。只需提供足够数量的细节来有效地训练您的模型,您就可以识别几乎任何种类的实体。

今天以前,您还必须用每个实体至少 250 篇文档和 100 个注释来训练 Amazon Comprehend 自定义实体识别程序。从今天开始,我们将训练 Amazon Comprehend 自定义实体识别模型的最低要求降低到每个实体类型 25 个注释。幕后建模经过改进后,您现在可以开始使用低至 3 个带注释的文档进行实验,分析初步结果,并通过添加其他注释和文档进行迭代。减少的限制仅适用于纯文本文档的自定义实体识别模型。

如需了解更多信息并开始使用,请访问 Amazon Comprehend 发布博客文章产品页面或我们的文档