亚马逊AWS官方博客
Tag: EMR
基于 AWS S3、EMR Flink、Presto 和 Hudi 的实时数据湖仓 – 使用 EMR 迁移 CDH
该博客介绍了将实时大数据系统从 CDH 迁移到亚马逊云科技 EMR 的项目。
OPPO大数据平台在亚马逊云科技上的成本优化最佳实践
OPPO在大数据平台的成本优化最佳实践。
Amazon EMR实战心得浅谈
EMR实战心得浅谈
Feast on AWS 解决方案
本文介绍了Feast框架的整体架构及设计思路,并step by step详细说明了Feast on AWS集成和使用,包括安装部署离线/在线特征库、使用特征库、特征库同步的方法等。对于使用Feast开源框架构建MLOps平台的用户,本文可以作为快速构建和开发指南
基于OpenLDAP与Kerberos的Amazon EMR身份认证方案(三):基于SASL/GSSAPI深度集成
本系列文章将基于OpenLDAP和Kerberos给出完整的Amazon EMR身份认证解决方案,全系列由三篇文章组成,涵盖三个相对独立又紧密关联的子话题,方案会详细介绍使用到的技术原理同时给出完备的执行脚本用于实际环境的搭建。
基于OpenLDAP与Kerberos的Amazon EMR身份认证方案(二):基于SSSD同步LDAP账号
本系列文章将基于OpenLDAP和Kerberos给出完整的Amazon EMR身份认证解决方案,全系列由三篇文章组成,涵盖三个相对独立又紧密关联的子话题,方案会详细介绍使用到的技术原理同时给出完备的执行脚本用于实际环境的搭建。
基于OpenLDAP与Kerberos的Amazon EMR身份认证方案(一):整合后台数据库
本系列文章将基于OpenLDAP和Kerberos给出完整的Amazon EMR身份认证解决方案,全系列由三篇文章组成,涵盖三个相对独立又紧密关联的子话题,方案会详细介绍使用到的技术原理同时给出完备的执行脚本用于实际环境的搭建。
从 Amazon EMR 和 AWS Glue 访问 Amazon S3 中数据的性能优化最佳实践
这篇文章介绍了使用 Amazon EMR 和 Amazon Glue 分析 Amazon S3 中数据时,实现所需性能扩展的最佳实践。我们重点强调了在 Amazon EMR 和 AWS Glue Spark 作业上针对 Apache Spark 进行优化。
Kylin 4 集成 Amazon Glue Catalog!
Kylin 4 集成 Amazon Glue Catalog
使用AWS托管MSK Connector和EMR Flink从AWS RDS进行CDC数据消费
Flink MSK CDC consumption