发布于: Jun 27, 2018

Amazon Comprehend 是一项自然语言处理 (NLP) 服务,可利用机器学习发现文本中的见解和关系。从今天开始,客户可以使用新的异步作业服务对 Amazon S3 存储桶中存储的文档集合进行分析。这是在已有的对 REST API 的单个和多个文档同步调用之外新增的功能,从而为您提供了多种最适合您应用程序需求的选项。

当应用程序不需要服务提供实时响应时,特别适合使用异步操作来分析大型数据集。例如,您可以将文本分析批处理安排为每天、每周,甚至每月运行一次。使用该异步选项,Amazon Comprehend 服务现在可以接受大小高达 100KB 的文档,因而,不必将大型文档截断即可进行命名实体识别 (NER) 和关键短语分析。(注意:用于异步情绪检测的最大文件大小仍限于每个文档 5 KB。)

经过此次发布,Amazon Comprehend 现在提供以下操作:

  • 同步单文档处理 - 针对单文档调用 Amazon Comprehend,并接收同步响应。
  • 同步多文档处理(每次请求对应 25 个文档)- 针对多达 25 个文档的集合调用 Amazon Comprehend,并接收同步响应。
  • 异步批处理(作业大小限制为 5GB,文档大小限制为 100KB)- 使用 Amazon S3 存储桶中存储的一组文档并启动异步操作来进行文档分析。分析结果将返回 S3 存储桶中。

请参阅 Amazon Comprehend 文档,了解如何开始使用异步处理操作。