亚马逊AWS官方博客

使用JDWP远程debug Amazon EMR上离线&在线应用

在AWS的云上大数据服务平台Amazon EMR上,我们可以使用JAVA技术栈的JDWP技术,对Spark,Flink两大最流行的离线、实时计算框架应用,在on yarn的hadoop集群上进行远程debug,这样开发的小伙伴能快速调试和定位生产环境中遇到的各种问题,而不用下载业务数据并在本地,或者只能依赖输出日志去推断问题,简化整个业务敏捷开发的运维和调优

消除复杂性以提高业务绩效:Bridgewater Associates 如何在 AWS 上构建安全、可扩展且基于 Spark 的研究服务

Bridgewater 的核心使命是通过分析市场驱动因素来理解世界的运作方式,并将这种理解转化为高质量的投资组合,为我们的客户提供投资建议。在 Bridgewater Technology 内,我们努力使我们的研究人员在他们最擅长的领域尽可能提高工作效率:建立对全球市场的基本理解。这意味着不再需要处理底层 IT 基础设施,而是专注于构建和改进他们的投资理念。

Amazon DynamoDB 中的单表与多表设计

对于了解 Amazon DynamoDB 的人士来说,单表设计的想法是目前最令人费解的概念之一。与每个实体有一个表的关系概念不同,DynamoDB 表通常在一个表中包含多个不同的实体。 您可以阅读 DynamoDB 文档,观看 re:Invent 讲座或其他视频,或者查看我的书,了解 DynamoDB 中使用单表设计的一些设计模式。我想在更高层次上探讨这个话题,重点介绍支持和反对单表设计的论点。