亚马逊AWS官方博客

Tag: Amazon Textract

使用AWS KMS对存储在自定义Amazon S3存储桶内的输出结果进行加密,并通过Amazon Textract实现多页文档处理

Amazon Textract是一项完全托管机器学习(ML)服务,可以从几乎任意类型的文档当中自动提取输出文本、手写内容及其他数据,从而轻松完成文档的规模化处理。Amazon Textract的功能全面超越了传统的简单光学字符识别(OCR),能够准确识别出表单内的字段内容以及表格中存储的信息。以此为基础,金融、医疗、法律以及房地产等众多行业得以轻松针对不同业务需求处理大量文档。

Read More

使用 Amazon Textract 与 Amazon Comprehend 从文档中提取自定义实体

机器学习与人工智能能够极大提升组织的敏捷水平,将原本只能手动完成的任务转为自动化流程,借此增强执行效率。在本文中,我们演示了一套端到端架构,可通过Amazon Textract与Amazon Comprehend提取候选人技能等自定义实体。本文还将大家讲解了如何使用Amazon Textract进行数据提取,以及如何使用Amazon Comprehend通过您的自有数据集训练自定义实体识别器,并借此实现自定义实体识别。这一流程可以广泛应用于各个行业,例如医疗保健与金融服务等。

Read More

使用 Amazon Textract、Amazon Comprehend 以及 Amazon Lex 从发票中提取会话式洞见

本文介绍了如何在Amazon Lex中创建一款会话式聊天机器人,使用Amazon Textract从图像或PDF文档中提取文本,使用Amazon Comprehend从文本中提取洞见,并通过机器人实现与洞见的交互。本文中所使用的代码皆发布在GitHub repo 当中,供您随意使用及扩展。我们也期待了解您如何将这套解决方案应用于实际用例,请在评论区中分享您的观点与疑问。

Read More