亚马逊AWS官方博客
Tag: S3
基于 AWS S3、EMR Flink、Presto 和 Hudi 的实时数据湖仓 – 使用 EMR 迁移 CDH
该博客介绍了将实时大数据系统从 CDH 迁移到亚马逊云科技 EMR 的项目。
Amazon EMR HBase on S3 之二级索引、Thrift 和性能评测
本文从实战的角度,解释一下亚马逊云科技客户在选择使用 HBase on S3 的时候比较关心的两个问题,一个是如何把已有的 HBase on HDFS 迁移到 HBase on S3,并包含二级索引的迁移;另一个是 HBase on S3 的性能问题。
OPPO大数据平台在亚马逊云科技上的成本优化最佳实践
OPPO在大数据平台的成本优化最佳实践。
利用DynamoDB和S3结合gzip压缩,最大化存储玩家数据
本文主要讲述在游戏场景下,根据DynamoDB的限制),在限制下尽可能存储更多的数据和当存储量超出限制时,扩展存储的最大化利用空间。重点描述如何利用DynamoDB+S3保存玩家存档中的大数据量属性,避免数据存在S3上后,在数据写入S3的时发生脏读的情况。同时利用gzip压缩减少数据大小,减少IO的开销提升性能。
SAP on Amazon部署必知必会
本博客从SAP on Amazon的部署选项,包括内存、CPU、存储、网络、操作系统以及高可用、灾备、备份和恢复、监控、部署和迁移等的介绍,让您如何把SAP系统部署迁移到Amazon。
Kylin 4 集成 Amazon Glue Catalog!
Kylin 4 集成 Amazon Glue Catalog
自动驾驶数据湖(四):可视化
云上自动驾驶数据湖参考架构和落地实践。
自动驾驶数据湖(三):图像处理流程管道
云上自动驾驶数据湖参考架构和落地实践。
自动驾驶数据湖(二):图像处理和模型训练
云上自动驾驶数据湖参考架构和落地实践。
使用Data Transfer Hub迁移MaxCompute数据至S3数据湖实践
本文介绍如何使用亚马逊云科技Data Transfer Hub 在线数据传输方案,以将阿里MaxCompute数据导入到亚马逊 S3数据湖