亚马逊AWS官方博客
利用 AWS Batch 来为容器化负载调用海量云端算力
利用AWS Batch的多节点并行作业为基于MPI的紧耦合容器化负载调用海量云端计算资源
Amazon Redshift 跨数据库查询入门指南(预览版)
Amazon Redshift是一套快速、可扩展且安全的全托管云数据仓库,能够以简单、经济、高效的方式,使用标准SQL以及现有ETL、商务智能(BI)和报告工具对你的数据进行分析。每一天,成千上万的客户使用Amazon Redshift处理EB级别的数据,并为商务智能、预测分析与实时流分析等强大的分析工作负载提供支持。
基于亚马逊云科技 CI/CD 和 Amazon Batch 服务构建云端单细胞分析流程
本文以10X Cell Ranger单细胞测序分析流程软件为例, 旨在以介绍通过Cromwell的网页提交分析任务,调度Amazon Batch服务提供计算资源,并辅以亚马逊云科技的CICD服务构建更新分析容器镜像。
为 Amazon WorkSpaces 构建基于Amazon FSx for Windows File Server的共享目录
介绍如何基于Amazon FSx for Windows File Server 为Amazon WorkSpaces构建可靠的用户共享存储功能
远程调度 EMR 集群的常见方式总结
亚马逊云科技上的 EMR 大数据平台提供了计算存储分离的弹性架构(计算在虚拟机上,存储在s3上),基于此,常见的如流式处理,即时查询等作业可以单独运行在一个长期开启的EMR集群之中;而对于定时,跑批等业务可以运行在动态启停的EMR集群之中。对于后者来讲,由于其动态启停的特性,我们往往需要外置任务调度器于EMR集群之外。在上述的背景之下,我们会在接下来的文章之中对于当调度器外置之后,常见的远程调度EMR集群的方式,相应的优缺点,相关的例子等方面进行探讨
使用 Deep Learning AMI 快速实现 CUDA,cuDNN 和深度学习框架版本兼容
AWS Deep Learning AMI 为机器学习从业者和研究人员提供基础设施和深度学习环境。您可以快速启动预装了主流深度学习框架的 Amazon EC2 实例,并且快速地切换 CUDA 版本实现与深度学习框架的兼容,轻松构建深度学习环境。从而让我们将更多的时间用于尝试新算法,学习新技术。
加速 Amazon RDS for MySQL 只读副本提升
本文主要讲述在一个RDS MySQL集群中,如何在有限的时间内尽可能加快从MySQL Read Replica中提升。
Amazon Glue 实现 JDBC 数据源增量数据加载
Amazon Glue实现JDBC数据源增量数据加载
使用 Amazon Glue 来调度 Amazon Redshift 跑 TPC-DS Benchmark
提供CDK模版部署Glue调度Redshift环境,并进行TPC-DS benchmark
2021年亚马逊云科技 re:Invent 全球大会分析专题与会者指南
re:Invent的分析专题提供各种数据分析相关演说与会议,亚马逊云科技分析专家及其客户将在这些会议上发表演讲。