亚马逊AWS官方博客

Category: Artificial Intelligence

使用Amazon SageMaker训练H2O模型并对其服务化

模型训练与服务化可以说是成功建立端到端机器学习(ML)流程的两大基本环节。这两个步骤通常需要不同的软件与硬件设置,才能为生产环境提供最佳组合。模型训练优化的目标是低成本、训练时间长度可行、科学上的灵活性以及良好的模型可解释性等;而模型服务化的优化目标是低成本、高吞吐以及低延迟。

使用Amazon SageMaker与Amazon ES KNN特征构建支持NLU的搜索应用程序

语义搜索引擎的兴起使电子商务与零售企业能够更轻松地为消费者提供搜索服务。基于自然语言理解(NLU)的搜索引擎使您可以通过首选会话语言直接表述自己的需求,而不再只能硬性依赖于以输入设备写下相应关键字。您可以使用母语以单词或句子执行查询,并由搜索引擎负责理解并提供最佳结果。

使用 Amazon SageMaker 托管 Spark 容器与 Amazon SageMaker SDK 按需运行无服务器Apache Spark数据处理作业

Amazon SageMaker广泛使用Docker容器,允许用户构建用于数据准备、训练及推理代码的运行时环境。Amazon SageMaker内置用于Amazon SageMaker Processing的Spark容器则提供一套托管Spark运行时,其中包含运行分布式数据处理工作负载所需要的各类库组件与依赖项。

通过 Amazon Textract 提取手写信息

总体而言,我们与AWS的合作关系帮助我们解决了一系列极具挑战性的业务难题,由此为客户带来巨大价值。我们计划与AWS继续合作,尝试解决其他更为艰难的问题,最终为我们的客户带来真正的业务价值。 大家可以通过多种方式快速上手Amazon Textract:与我们的AWS合作伙伴Quantiphi联系,联络您的客户经理或解决方案架构师,或者访问我们的 Amazon Textract产品页面以了解更多可用资源。

和Netflix一起探索基于DJL的 Java 分布式在线深度学习推理架构

Netflix 是世界上最大流媒体平台提供商。它拥有多个知名影视剧IP例如 《纸牌屋》和《白夜追凶》,同时也拥有超过1.9亿来自全球各地的订阅用户。对于Netflix来说,时刻让用户拥有最佳使用体验是最为重要的。其中一个维持它的秘诀就是使用深度学习模型来提升信息的价值。Netflix在不侵犯用户隐私的前提下,通过收集程序的日志(非用户数据)来分析检查系统的稳定性。具体实现则是利用深度学习模型 + 微服务架构来达到实时分析超大规模的日志的目标。

使用AWS KMS对存储在自定义Amazon S3存储桶内的输出结果进行加密,并通过Amazon Textract实现多页文档处理

Amazon Textract是一项完全托管机器学习(ML)服务,可以从几乎任意类型的文档当中自动提取输出文本、手写内容及其他数据,从而轻松完成文档的规模化处理。Amazon Textract的功能全面超越了传统的简单光学字符识别(OCR),能够准确识别出表单内的字段内容以及表格中存储的信息。以此为基础,金融、医疗、法律以及房地产等众多行业得以轻松针对不同业务需求处理大量文档。