亚马逊AWS官方博客
Tag: Analytic
使用 AWS Glue、Apache Hudi 和 Amazon S3 构建无服务器管道以分析串流数据
企业通常会积累海量数据,并继续生成越来越多的数据量,从 TB 级到 PB 级,有时甚至会生成 EB 级的数据。此类数据通常在不同的系统中生成,需要聚合到一个位置进行分析和生成洞察。借助数据湖架构,您可以聚合各个孤岛中的数据,将其存储在一个集中式存储库中,实施数据治理,并支持基于这些存储的数据进行分析和机器学习(ML)。
通过 Amazon OpenSearch Service 上的 AWS Graviton2 实例提高性能
Amazon OpenSearch Service(Amazon Elasticsearch Service 的下一代产品)是 AWS 为 OpenSearch 提供的一项完全托管式服务。它是一个开源搜索和分析套件,用于广泛的使用场景,例如实时应用程序监控、日志分析和网站搜索。 现在支持 Graviton2 实例进行性能优化
Cynamics 如何使用 AWS 构建大规模、近乎实时的流式传输 AI 推理系统
这篇博文由Cynamics 联合创始人兼首席技术官 Yehezkel Aviv 博士和 Cynamics 工程主管 Sapir Kraus 共同撰写。在竞争激烈的网络安全市场,Cynamics 是首个基于小型网络样本的解决方案,至今学术界和行业都认为这是一项艰难且尚未解决的挑战.
使用 Amazon MSK Connect、Apache Flink 和 Apache Hudi 创建低延迟的源到数据湖管道
近年来,我们已经从整体式架构向微服务架构转变。微服务架构使应用程序更易于扩展和更快开发,从而实现创新并加快新功能的上市。但是,这种方法会导致数据存在于不同的孤岛中,这使得执行分析变得困难。为了获得更深入和更丰富的洞察,您应该将不同孤岛中的所有数据集中到一个地方。
借助 Amazon Redshift 为具有强大抗风险能力的使用案例提供支持
Amazon Redshift 是最受欢迎、最快的云数据仓库,提供与您的数据湖和其他数据源的无缝集成,性能出色,本文探讨了将 Amazon Redshift 作为核心数据仓库平台来最大限度地提高数据可用性的不同架构和使用案例。
使用 Amazon Lake Formation 为数据网格构建数据共享工作流
允许不同的业务部门(LOB, Lines of Business)和企业部门独立运营,并将其数据作为产品提供。使用亚马逊云科技数据管理工具可以实现这样的共享模式