亚马逊AWS官方博客

Category: Artificial Intelligence

使用Amazon SageMaker与Amazon ES KNN特征构建支持NLU的搜索应用程序

语义搜索引擎的兴起使电子商务与零售企业能够更轻松地为消费者提供搜索服务。基于自然语言理解(NLU)的搜索引擎使您可以通过首选会话语言直接表述自己的需求,而不再只能硬性依赖于以输入设备写下相应关键字。您可以使用母语以单词或句子执行查询,并由搜索引擎负责理解并提供最佳结果。

Read More

使用 Amazon SageMaker 托管 Spark 容器与 Amazon SageMaker SDK 按需运行无服务器Apache Spark数据处理作业

Amazon SageMaker广泛使用Docker容器,允许用户构建用于数据准备、训练及推理代码的运行时环境。Amazon SageMaker内置用于Amazon SageMaker Processing的Spark容器则提供一套托管Spark运行时,其中包含运行分布式数据处理工作负载所需要的各类库组件与依赖项。

Read More

通过 Amazon Textract 提取手写信息

总体而言,我们与AWS的合作关系帮助我们解决了一系列极具挑战性的业务难题,由此为客户带来巨大价值。我们计划与AWS继续合作,尝试解决其他更为艰难的问题,最终为我们的客户带来真正的业务价值。 大家可以通过多种方式快速上手Amazon Textract:与我们的AWS合作伙伴Quantiphi联系,联络您的客户经理或解决方案架构师,或者访问我们的 Amazon Textract产品页面以了解更多可用资源。

Read More

和Netflix一起探索基于DJL的 Java 分布式在线深度学习推理架构

Netflix 是世界上最大流媒体平台提供商。它拥有多个知名影视剧IP例如 《纸牌屋》和《白夜追凶》,同时也拥有超过1.9亿来自全球各地的订阅用户。对于Netflix来说,时刻让用户拥有最佳使用体验是最为重要的。其中一个维持它的秘诀就是使用深度学习模型来提升信息的价值。Netflix在不侵犯用户隐私的前提下,通过收集程序的日志(非用户数据)来分析检查系统的稳定性。具体实现则是利用深度学习模型 + 微服务架构来达到实时分析超大规模的日志的目标。

Read More

使用Amazon SageMaker Ground Truth为机器学习工作流构建实时数据标记管道

Amazon SageMaker Ground Truth流式标记作业 提供基础设施与资源,可供您创建持续运行的标记作业。此作业可按需接收新的数据对象并将其发送至工作人员进行标记。您可以将多个流式标记作业链接起来,由此创建出更复杂、更完善的数据标记管道。

Read More

使用AWS KMS对存储在自定义Amazon S3存储桶内的输出结果进行加密,并通过Amazon Textract实现多页文档处理

Amazon Textract是一项完全托管机器学习(ML)服务,可以从几乎任意类型的文档当中自动提取输出文本、手写内容及其他数据,从而轻松完成文档的规模化处理。Amazon Textract的功能全面超越了传统的简单光学字符识别(OCR),能够准确识别出表单内的字段内容以及表格中存储的信息。以此为基础,金融、医疗、法律以及房地产等众多行业得以轻松针对不同业务需求处理大量文档。

Read More

基于 Comprehend 的玩家评论分析解决方案

本解决方案利用Comprehend, ECS Fargate,Aurora Serverless为主要组件,构造了基于Comprehend的玩家评论分析方案,借助此解决方案,客户可以查看并分析游戏在GooglePlay和AppStore中的游戏评论,并得到由Comprehend解析出的相关洞见。Comprehend会分析出可每条评论的情感倾向和关键词,帮助游戏开发者第一时间掌握用户反馈,并基于此进行更迭改进。

Read More