亚马逊AWS官方博客
Category: Analytics
在 AWS EC2 上快速部署 NebulaGraph:图数据分析实战
随着数据关联性的日益增强,传统关系型数据库在处理复杂关系和大规模连接查询时表现出瓶颈。图数据库以其强大的关系表达能力和高效的遍历性能,成为社交网络、推荐系统、知识图谱等领域的首选技术。NebulaGraph 作为一款开源分布式图数据库,具备高性能、可扩展的特点,适合处理海量图数据。 本文将带你一步步在 AWS EC2 上快速部署 NebulaGraph,并通过一个示例场景完成图数据的生成与分析,帮助你快速上手 NebulaGraph 图数据库的实战应用。
AWS Lake Formation 数据权限管控实践指南:从 EMR 集成到 BI 工具访问控制
本文详细介绍 AWS Lake Formation 数据湖权限管控实践,展示如何通过集中式权限模型实现从元数据到底层数据的精细化访问控制。重点阐述 Lake Formation 与 EMR 的无缝集成及 BI 工具通过 Athena 访问数据时的权限控制,提供完整配置步骤和实战案例,助力企业构建安全可控的数据湖方案。
当 PyIceberg 和 DuckDB 遇见 AWS S3 Tables:打造 Serverless 数据湖“开源梦幻组合”
本文介绍了一套 Serverless 方案,利用 S3 Tables (内置 Iceberg) 存储用户行为数据,并通过 PyIceberg 和 DuckDB 在 AWS Lambda 等环境实现直接、高效的即时查询。无需集群运维,即可低成本地分析 S3 数据,加速用户行为洞察。
基于 Agentic AI + Amazon Redshift MCP Server 实现 Agentic Data Analysis
本文探讨和验证 Agentic AI 与 Amazon Redshift MCP Server 的结合如何实现 Agentic Data Analysis,并展望这一技术在未来数据分析领域的潜力和发展方向。
基于 AWS S3 Tables 构建高效数据分析平台:架构设计与实施要点
在当今数字化转型加速的商业环境中,企业在处理日活数据分析时面临着四大关键痛点: 首先,传统的 Iceberg存 […]
AWS 一周综述:Amazon Nova Premier、Amazon Q 开发者版、Amazon Q CLI、Amazon CloudFront、AWS Outposts 等(2025 年 5 月 5 日)
上周,我前往泰国参加了曼谷 AWS Summit。这是一场充满活力且激动人心的活动。我们设立了开发者休息室,开 […]
AWS 一周综述:Amazon Q 开发者版、AWS 账户管理最新动态等(2025 年 4 月 28 日)
峰会季已经全面开启! 如果您还没有参加过 AWS Summit,我强烈建议您区附近举办的峰会看看。它们是全天候 […]
EMR Flink-Hudi 实时分析系统成本优化
优化传统架构 EMR、Flink 和 Kafka 对实时数据处理的方案,通过 EMR Flink CDC 集群将数据直接从数据源写入 Hudi。
一分钟从零构建数据湖,S3 Tables 究竟有啥魔力?
2024 年,亚马逊云科技发布了 S3 Tables,内置对 Apache Iceberg 的支持,旨在优化大规模表格数据的存储和查询性能。S3 Tables 通过自动化的表维护和与亚马逊云科技的分析服务的无缝集成,帮助企业更快速地构建数据湖,简化权限管理,并提升查询性能和事务处理能力,满足现代数据驱动型业务的需求。本文将探讨 S3 Tables 技术的应用场景及其对业务的收益及最佳实践,提供生产中可参考的价值。
AWS 一周回顾:Amazon EKS、Amazon OpenSearch、Amazon API Gateway 等(2025 年 4 月 7 日)
AWS Summit 季将于本周开始! 免费活动现已陆续启动,我们将汇聚云计算社区成员共同交流、协作与学习。无 […]