亚马逊AWS官方博客
利用 Amazon HPC 加速药物研发分子对接任务
本文旨在介绍如何利用亚马逊云科技云服务实现药物发现阶段的大规模分子虚拟筛选任务。
EKS 使用Spot 实例最佳实践
帮助大家回顾了EKS集成SPOT使用方式,通过亚马逊云科技不停推出的新的工具和功能的增强,来实现Spot 使用的最佳实践,在大规模工作负载使用Spot的情况下,既有效的节约成本,又相对提升工作负载的可靠性。
使用Amazon Glue构建无服务器流式ETL作业
在本文中,我们将深入探讨Amazon Glue中的流式ETL,介绍此功能如何帮助您在流式数据上构建持续的ETL应用程序。Amazon Glue中的流式ETL基于Apache Spark的结构化流引擎,该引擎提供一种高容错、可扩展且易于实现的方法,能够实现端到端的流处理。本文向大家展示使用Amazon Glue构建流处理管道的示例,其中包括从 Amazon Kinesis Data Streams当中读取流式数据、发现schema、运行流式ETL并将结果写入至接收端。
在亚马逊云科技数据存储中保护敏感数据的最佳实践
本文将重点介绍常规数据安全模式,以及可用于保护您数据的相应AWS安全控制方法。本文中会提及Amazon RDS与DynamoDB,但关于更多具体实现层面的细节信息,请参阅在Amazon RDS中应用敏感数据保护最佳实践和在Amazon DynamoDB中应用敏感数据保护最佳实践。
利用 AWS Batch 来为容器化负载调用海量云端算力
利用AWS Batch的多节点并行作业为基于MPI的紧耦合容器化负载调用海量云端计算资源
Amazon Redshift 跨数据库查询入门指南(预览版)
Amazon Redshift是一套快速、可扩展且安全的全托管云数据仓库,能够以简单、经济、高效的方式,使用标准SQL以及现有ETL、商务智能(BI)和报告工具对你的数据进行分析。每一天,成千上万的客户使用Amazon Redshift处理EB级别的数据,并为商务智能、预测分析与实时流分析等强大的分析工作负载提供支持。
基于亚马逊云科技 CI/CD 和 Amazon Batch 服务构建云端单细胞分析流程
本文以10X Cell Ranger单细胞测序分析流程软件为例, 旨在以介绍通过Cromwell的网页提交分析任务,调度Amazon Batch服务提供计算资源,并辅以亚马逊云科技的CICD服务构建更新分析容器镜像。
为 Amazon WorkSpaces 构建基于Amazon FSx for Windows File Server的共享目录
介绍如何基于Amazon FSx for Windows File Server 为Amazon WorkSpaces构建可靠的用户共享存储功能
远程调度 EMR 集群的常见方式总结
亚马逊云科技上的 EMR 大数据平台提供了计算存储分离的弹性架构(计算在虚拟机上,存储在s3上),基于此,常见的如流式处理,即时查询等作业可以单独运行在一个长期开启的EMR集群之中;而对于定时,跑批等业务可以运行在动态启停的EMR集群之中。对于后者来讲,由于其动态启停的特性,我们往往需要外置任务调度器于EMR集群之外。在上述的背景之下,我们会在接下来的文章之中对于当调度器外置之后,常见的远程调度EMR集群的方式,相应的优缺点,相关的例子等方面进行探讨
使用 Deep Learning AMI 快速实现 CUDA,cuDNN 和深度学习框架版本兼容
AWS Deep Learning AMI 为机器学习从业者和研究人员提供基础设施和深度学习环境。您可以快速启动预装了主流深度学习框架的 Amazon EC2 实例,并且快速地切换 CUDA 版本实现与深度学习框架的兼容,轻松构建深度学习环境。从而让我们将更多的时间用于尝试新算法,学习新技术。