亚马逊AWS官方博客
Category: Analytics
当 PyIceberg 和 DuckDB 遇见 AWS S3 Tables:打造 Serverless 数据湖“开源梦幻组合”
本文介绍了一套 Serverless 方案,利用 S3 Tables (内置 Iceberg) 存储用户行为数据,并通过 PyIceberg 和 DuckDB 在 AWS Lambda 等环境实现直接、高效的即时查询。无需集群运维,即可低成本地分析 S3 数据,加速用户行为洞察。
基于 Agentic AI + Amazon Redshift MCP Server 实现 Agentic Data Analysis
本文探讨和验证 Agentic AI 与 Amazon Redshift MCP Server 的结合如何实现 Agentic Data Analysis,并展望这一技术在未来数据分析领域的潜力和发展方向。
基于 AWS S3 Tables 构建高效数据分析平台:架构设计与实施要点
在当今数字化转型加速的商业环境中,企业在处理日活数据分析时面临着四大关键痛点: 首先,传统的 Iceberg存 […]
AWS 一周综述:Amazon Nova Premier、Amazon Q 开发者版、Amazon Q CLI、Amazon CloudFront、AWS Outposts 等(2025 年 5 月 5 日)
上周,我前往泰国参加了曼谷 AWS Summit。这是一场充满活力且激动人心的活动。我们设立了开发者休息室,开 […]
AWS 一周综述:Amazon Q 开发者版、AWS 账户管理最新动态等(2025 年 4 月 28 日)
峰会季已经全面开启! 如果您还没有参加过 AWS Summit,我强烈建议您区附近举办的峰会看看。它们是全天候 […]
EMR Flink-Hudi 实时分析系统成本优化
优化传统架构 EMR、Flink 和 Kafka 对实时数据处理的方案,通过 EMR Flink CDC 集群将数据直接从数据源写入 Hudi。
一分钟从零构建数据湖,S3 Tables 究竟有啥魔力?
2024 年,亚马逊云科技发布了 S3 Tables,内置对 Apache Iceberg 的支持,旨在优化大规模表格数据的存储和查询性能。S3 Tables 通过自动化的表维护和与亚马逊云科技的分析服务的无缝集成,帮助企业更快速地构建数据湖,简化权限管理,并提升查询性能和事务处理能力,满足现代数据驱动型业务的需求。本文将探讨 S3 Tables 技术的应用场景及其对业务的收益及最佳实践,提供生产中可参考的价值。
AWS 一周回顾:Amazon EKS、Amazon OpenSearch、Amazon API Gateway 等(2025 年 4 月 7 日)
AWS Summit 季将于本周开始! 免费活动现已陆续启动,我们将汇聚云计算社区成员共同交流、协作与学习。无 […]
使用 FluentBit 抽取日志到 AOS 中不同索引 Index
FluentBit 是一款轻量级的日志处理器,常用于从各种数据源收集日志并将其发送到不同的目标,包括 AWS OpenSearch Service (AOS)。在真实的业务场景中往往存在多种类型的日志,例如系统日志、安全日志、应用日志等。不同类型的日志需要隔离保存并实现访问控制,在 AOS 中可以使用索引 Index 的设计实现数据的分类存储、访问控制以及生命周期管理。
使用 Amazon OpenSearch Service 中的 Amazon Q Developer 加速运营分析
现在,我很高兴地宣布 Amazon Q Developer 支持 Amazon OpenSearch Serv […]