亚马逊AWS官方博客

AWS Team

Author: AWS Team

使用 AWS Lake Formation 配合 Amazon EMR 控制数据访问与权限

数据的使用在数据格式和规模两个方面已经取得了快速的发展。对不同技术(关系数据库、NoSQL、图数据库、明文文件等)进行管理则会显著增加运营开销。随着竞争烈度的提升,数据规模也将随业务推进而飞速发展,带来更大的计算与存储资源压力。这一切,都迫使组织需求通往更高敏捷性与速度水平的道路。

使用运行在 Amazon EC2 G4 实例上的 Amazon EMR,提升 RAPIDS XGBoost 性能并降低运营成本

数据的使用在数据格式和规模两个方面已经取得了快速的发展。对不同技术(关系数据库、NoSQL、图数据库、明文文件等)进行管理则会显著增加运营开销。随着竞争烈度的提升,数据规模也将随业务推进而飞速发展,带来更大的计算与存储资源压力。这一切,都迫使组织需求通往更高敏捷性与速度水平的道路。

开发应用程序迁移方法以使用 Amazon Redshift 使您的数据仓库现代化

本文展示一款简单的应用程序,可供制药企业、医疗保健专业人士以及消费者通过药监局及国家卫生研究院等权威来源处查找有用信息。使用这套架构及相关代码库,您可以将这套解决方案整合至关于不良事件分析及报告的其他下游应用程序当中。我们希望本文能够帮助大家接触ML技术、提高ML采用率,同时改善患者的预后与护理质量。

使用 Amazon Comprehend Medical 以自然语言为基础查询药物不良反应与召回事件

本文展示一款简单的应用程序,可供制药企业、医疗保健专业人士以及消费者通过药监局及国家卫生研究院等权威来源处查找有用信息。使用这套架构及相关代码库,您可以将这套解决方案整合至关于不良事件分析及报告的其他下游应用程序当中。我们希望本文能够帮助大家接触ML技术、提高ML采用率,同时改善患者的预后与护理质量。

使用 Amazon Textract 与 Amazon Comprehend 从文档中提取自定义实体

机器学习与人工智能能够极大提升组织的敏捷水平,将原本只能手动完成的任务转为自动化流程,借此增强执行效率。在本文中,我们演示了一套端到端架构,可通过Amazon Textract与Amazon Comprehend提取候选人技能等自定义实体。本文还将大家讲解了如何使用Amazon Textract进行数据提取,以及如何使用Amazon Comprehend通过您的自有数据集训练自定义实体识别器,并借此实现自定义实体识别。这一流程可以广泛应用于各个行业,例如医疗保健与金融服务等。

使用 Amazon Translate 以 Office Open XML 格式翻译文档、电子表格与演示文稿

在本文中,我们探讨了如何通过异步批量翻译对DOCX格式的文档进行翻译。关于翻译电子表格与演示文稿,其过程与翻译DOCX文件相同。AWS提供的翻译服务Amazon Translate使用简单,且您只需要根据翻译的每种格式的文档中的字符数(包含空格)进行付费。您现在可以在支持批量翻译的所有区域内翻译Office文档。如果您还不熟悉Amazon Translate,不妨先从Free Tier免费套餐起步。此套餐将从您提交的第一项翻译请求开始,在随后的12个月内每月提供2百万个字符的免费翻译配额。

SNCF Réseau 和 Olexya 如何将 Caffe2 计算机视觉流水线任务迁移至 Amazon SageMaker 中的 Managed Spot Training

Amazon SageMaker支持从数据注释、到生产部署、再到运营监控的整个ML开发周期。正如Olexya与SNCF Réseau的工作所示,Amazon SageMaker具有良好的框架中立性,能够容纳各类深度学习工作负载及框架。除了预先为Sklearn、TensorFlow、PyTorch、MXNet、XGBoost以及Chainer创建配套Docker镜像与SDK对象以外,您也可以使用自定义Docker容器,几乎任何框架,如PeddlePaddle、Catboost、R以及Caffe2。