跳至主要内容

Amazon Comprehend 文档

Amazon Comprehend 是一项自然语言处理(NLP)服务,使用机器学习来发现文本中的洞察信息。Amazon Comprehend 提供关键词提取、情绪分析、实体识别、主题建模和语言检测功能,因此您可以轻松地将自然语言处理集成到您的应用程序中。

关键词提取

关键词提取 API 可返回关键词或谈话要点以及证明此为关键词的置信度。

情绪分析

情绪分析 API 可返回文本的总体情绪分数以及与文本输入中的特定实体(正面、负面、中立或混合)相关的情绪。

语法分析

借助 Amazon Comprehend Syntax API,客户能够使用令牌化和词性(PoS)分析文本,识别文本中的名词和形容词等单词边界和标签。

实体识别

实体识别 API 可返回根据提供的文本分类的命名实体(“人物”、“地点”和“位置”等)。

自定义实体

自定义实体允许您自定义 Amazon Comprehend 来识别特定于您的域的条款。使用 AutoML,Comprehend 将从少量的私有示例索引学习(例如,保单编号列表和其中所用的文本),然后训练私有的自定义模型以便在任意其他文本块中识别这些条款。 

语言检测

语言检测 API 可识别出 100 多种语言编写的文本,并返回主导语言以及证明其占据主导地位的置信度得分。

自定义分类

自定义分类 API 让您可以使用业务特定标签构建自定义文本分类模型,而无需学习 ML。例如,您的客户支持组织可以使用自定义分类,根据客户对问题的描述按问题类型对入站请求进行分类。创建自定义模型很简单。您可以为要使用的每个标签提供文本示例,然后,Comprehend 会训练这些标签以创建自定义模型。

主题建模

主题建模 API 可从文档集合中识别出相关术语或主题。它还有助于识别集合中最常见的主题,并按组整理,然后将文档映射到相应主题。

Comprehend Medical

医学具名实体和关系提取(NERe)– 医学 NERe API 可返回药物、医学状况、检验、治疗和程序(TTP)、解剖以及受保护的健康信息(PHI)等医学信息。它还有助于识别所提取的与药物和 TTP 有关的子类之间的关系。此外还有作为实体“特质”提供的上下文信息(否定,或诊断是否属于迹象或症状)。

医学本体链接 – 医学本体链接 API 可以识别医学信息并将其链接到标准医学本体中的代码和概念。医学本体链接 API 还可以将上下文信息检测为实体特征(例如,否定)。

其他信息

有关服务控制、安全特征和功能的更多信息,包括有关存储、检索、修改、限制和删除数据的信息(如适用),请参阅 https://docs.aws.amazon.com/index.html。对于 http://aws.amazon.com/agreement 上的《AWS 客户协议》或者您与 AWS 之间签订的用于管理您使用 AWS 服务的其他协议而言,这些其他信息并不构成此文档的一部分。