亚马逊AWS官方博客
Category: AWS Big Data
【Agentic AI for Data系列】开发新范式:AI驱动的数据革命(先导篇)
引言 长期以来,业界专注于Data for AI,即为人工智能提供高质量数据。正如吴恩达教授的Data-Cen […]
【Agentic AI for Data系列】Kiro实战:DuckDB vs Spark技术选型全流程
1. 引言:技术选型的新挑战 当面临DuckDB与Spark的技术选型时,你是否也曾困惑:新兴的DuckDB真 […]
异构 ETL 环境的 AI 驱动数据血缘管理系统
背景介绍 随着企业的不断发展和数字化转型,数据已经成为最宝贵的资产。在这个过程中,企业构建并运行着海量的数据管 […]
使用 Amazon S3,AWS Glue 和 BladePipe 五分钟实现数据实时入湖
介绍 Apache Iceberg 是一种开放的数据表格式,解决了在数据湖管理方面的诸多痛点,如元数据混乱、文 […]
通过 ODCR 和 Prioritized Allocation Strategy 构建高效、经济的 EMR 集群(一)
本文通过实际场景,详细介绍了 EMR 集群创建与扩缩容时的两种策略:为普通集群使用 Open ODCR 实现成本与资源的平衡,为核心任务集群应用 Targeted ODCR 确保效率与可靠性。文中提供了完整配置示例供您参考。
基于 Apache Kafka 和 AWS 构建端到端的无服务器流式 ETL 管道
使用 Apache Kafka、Amazon Redshift Serverless 和 Amazon EMR Serverless 构建端到端无服务器流式 ETL 管道
利用 Serverless 方式自动化设置 EMR 集群时区
在 EMR 使用场景中,数据分析需要对 EMR on EC2 集群节点进行自动化设置指定正确的时区。
亚马逊云科技异常流量监控告警
本文将介绍一种出口流量监控方案,它融合了亚马逊云科技原生服务和第三方监控工具 Grafana,为您呈现一种全新的流量监控体验。
从 AWS DynamoDB 迁移数据到 AWS Aurora MySQL
一、概述 虽然 AWS DynamoDB 提供了高性能、可扩展的 NoSQL 解决方案,但在某些业务场景下存在 […]
Amazon OpenSearch Service 宣布 Elasticsearch 和 OpenSearch 版本的标准支持和扩展支持日期
Amazon OpenSearch Service 支持 19 个版本的 Elasticsearch 和 11 个版本的 OpenSearch
