Amazon Comprehend 是一项自然语言处理 (NLP) 服务,使用机器学习来发现文本中的洞察信息。Amazon Comprehend 提供自定义实体识别、自定义分类、关键词提取、情绪分析、实体识别和更多 API,以便您可以轻松将自然语言处理集成到您的应用程序中。您只需在应用程序中调用相应 Amazon Comprehend API 并提供源文档或文本的位置即可。这些 API 将以 JSON 格式输出实体、关键词、情绪和语言,以供您在应用程序中使用。

自定义实体识别

自定义实体识别允许您自定义 Amazon Comprehend 来识别特定于您的域的条款。使用 AutoML,Comprehend 将从一些小示例集中进行学习(例如,保单号码、索赔号码或 SSN 列表),然后训练私有的自定义模型,以在 PDF、纯文本或 Microsoft Word 文档中的任何其他数据块中识别索赔号码之类的术语 – 无需机器学习。 有关更多详细信息,请参阅本文档页面。 

自定义分类

自定义分类 API 让您可以使用业务特定标签轻松构建自定义文本分类模型,而无需学习 ML。例如,您的客户支持组织可以使用自定义分类,根据客户对问题的描述自动按问题类型对入站请求进行分类。  使用您的自定义模型,您可以轻松调整网站评论、对客户反馈进行分类,以及整理工作组文档。有关更多详细信息,请参阅本文档页面

实体识别

实体识别 API 会返回根据提供的文本自动分类的命名实体(“人物”、“地点”和“位置”等)。 有关更多详细信息,请参阅本文档页面

情绪分析

情绪分析 API 会返回文本的整体情绪(正面、负面、中性或混合)。 有关更多详细信息,请参阅本文档页面。 

Targeted Sentiment

Targeted Sentiment 通过识别对文本中实体的情绪(正面、负面、中性或混合),提供更细粒度的情绪洞察信息。有关更多详细信息,请参阅本文档页面。

PII 识别和编辑

使用 Amazon Comprehend ML 功能检测和编辑客户电子邮件、支持票证、产品评论、社交媒体等中的个人身份信息 (PII)。不需要任何 ML 经验。例如,您可以在索引搜索解决方案中的文档之前分析支持票证和知识文章来检测 PII 实体和编辑文本。在此之后,搜索解决方案将没有文档中的 PII 实体。编辑 PII 实体可帮助您保护隐私和符合当地法律法规。 有关更多详细信息,请参阅本文档页面

毒性检测

Comprehend 毒性检测提供了一种简单的、基于 NLP 的解决方案,用于检测基于文本的文档中的有毒内容。该功能开箱即用,可用于协调在线平台中的点对点对话以及生成式人工智能输入和输出。有关更多详细信息,请参阅此文档页面。

提示安全性分类

Comprehend 提供了一个预先训练的二元分类器,可以将输入提示分类为有害或无害。可以将其集成以允许 LLM 仅对无害内容做出响应。有关更多详细信息,请参阅此文档页面

关键词提取

关键词提取 API 会返回关键词或谈话要点以及证明此为关键词的置信度。 有关更多详细信息,请参阅本文档页面

  • 示例文本:我是一名发烧级摄影师,日常主要使用数码单反相机以及随身携带的拍立得相机。虽然数码单反相机具有无与伦比的强大功能和便利性,但拍立得相机也有一些神奇之处。也许您正在拍摄纪实片,或者您拍摄的每个镜头都是独一无二的实物(这在当今世界照片不胜枚举的 Instagram 和 Facebook 上显得与众不同)。我敢肯定地说,它们用起来很有趣,如果您在派对上拿出来其中一个,大家都会眼前一亮。

    关键词 置信度
    发烧级摄影师 0.99
    数码单反相机 0.97
    拍立得相机 0.99
    日常使用 0.99
    强大功能和便利性 0.94
    纪实片 0.99
    每个镜头 0.92
    独一无二的实物 0.99
    当今 0.91
    世界 0.99
    Instagram 和 Facebook 0.99

事件检测

Comprehend Events 可让您从文档中提取事件结构,将文本页面提炼为易于处理的数据,供您的 AI 应用程序或图形可视化工具使用。使用该 API,您可以在没有 NLP 经验的情况下,大规模地回答大型文档集上的“谁-什么-何时-何地”问题。使用 Comprehend Events 提取以非结构化文本表示的真实世界事件和相关实体的详细信息。 有关更多详细信息,请参阅本文档页面。 

语言检测

语言检测 API 可自动识别出 100 多种语言编写的文本,并返回主导语言以及证明其占据主导地位的置信度得分。 有关更多详细信息,请参阅本文档页面

语法分析

借助 Amazon Comprehend Syntax API,客户能够使用分词断句和词性 (PoS) 分析文本,识别文本中的名词和形容词等单词边界和标签。 有关更多详细信息,请参阅本文档页面

主题建模

主题建模 API 可从存储在 Amazon S3 的文档集合中识别出相关术语或主题。它会识别集合中最常见的主题,并按组整理,然后将文档映射到相应主题。 有关更多详细信息,请参阅本文档页面

多语言支持

Amazon Comprehend 可以对德语、英语、西班牙、意大利语、
葡萄牙语、法语、日语、韩语、印地语、阿拉伯语、中文(简体)、中文(繁体)文本进行文本分析。要构建其他语言的应用程序,客户可以使用 Amazon Translate 将文本转换为 Comprehend 支持的语言,然后使用 Comprehend 执行文本分析。有关语言支持的更多详细信息,请参阅文档页面

了解有关 Amazon Comprehend 定价的更多信息

访问定价页面
准备好开始使用了吗?
注册
还有更多问题?
联系我们