S3 | 亚马逊AWS官方博客

基于 AWS S3、EMR Flink、Presto 和 Hudi 的实时数据湖仓 – 使用 EMR 迁移 CDH

该博客介绍了将实时大数据系统从 CDH 迁移到亚马逊云科技 EMR 的项目。

Amazon EMR HBase on S3 之二级索引、Thrift 和性能评测

本文从实战的角度，解释一下亚马逊云科技客户在选择使用 HBase on S3 的时候比较关心的两个问题，一个是如何把已有的 HBase on HDFS 迁移到 HBase on S3，并包含二级索引的迁移；另一个是 HBase on S3 的性能问题。

OPPO大数据平台在亚马逊云科技上的成本优化最佳实践

OPPO在大数据平台的成本优化最佳实践。

利用DynamoDB和S3结合gzip压缩，最大化存储玩家数据

本文主要讲述在游戏场景下，根据DynamoDB的限制），在限制下尽可能存储更多的数据和当存储量超出限制时，扩展存储的最大化利用空间。重点描述如何利用DynamoDB+S3保存玩家存档中的大数据量属性，避免数据存在S3上后，在数据写入S3的时发生脏读的情况。同时利用gzip压缩减少数据大小，减少IO的开销提升性能。