发布于: May 29, 2019
我们很高兴地宣布,自 re:Invent 2018 以来一直提供预览版的 Amazon Textract 现已全面推出。Amazon Textract 是一种托管机器学习服务,可自动从几乎任何文档中提取文本和结构化数据。使用 Amazon Textract,客户可以快速自动执行文档工作流程,在几小时内处理数百万页文档。
Amazon Textract 的功能不只是简单的光学字符识别 (OCR),它还可以识别表单中字段的内容、表格中存储的信息,以及展示信息的上下文。Amazon Textract 的 API 支持多种图像格式,如扫描、PDF 和照片,客户可以将其与其他 AWS 机器学习服务(如 Amazon Comprehend、Amazon Comprehend Medical 和 Amazon Translate)一起使用,以便从提取的文本和数据中获得更深层的含义。提取的文本和数据还可用于在大型文档存档上构建智能搜索,或者加载到数据库中以供应用程序使用,例如会计、审计和合规性软件。要了解有关 Amazon Textract 的更多信息,请访问 Amazon Textract 网站。