亚马逊AWS官方博客
在Apache DataHub中整合Amazon Glue任务的数据血缘
本文将介绍如何在Apache DataHub中整合Amazon Glue任务的数据血缘,包括导入Glue Catalog的元数据信息,Glue Spark任务中表和字段级别的血缘关系,通过DataHub来统一管理和查询大数据目录。
基于 HAMi 实现亚马逊云科技 Trainium 与 Inferentia 核心级共享与策略性拓扑调度
本文将从代码实现层面出发,详细剖析 HAMi 在支持亚马逊云科技 Neuron 核心级共享、拓扑感知调度等核心功能时的具体设计与实现原理。
从智能工厂到车联网:S3 Tables 双模式写入实战指南
本文介绍基于 AWS S3 Tables 的两种数据写入方案:Lambda + PyIceberg 适合批量数据上传场景,Kinesis Firehose 适合实时数据流处理场景。提供完整的架构设计、代码实现和部署指南,帮助开发者根据不同业务需求选择最优的数据写入策略。
使用Amazon Q Developer CLI快速构建市场分析智能体
借助亚马逊云科技云Q Developer CLI,帮助企业快速实现智能体市场分析的场景落地
告别 nconnect 限制:FSx for NetApp ONTAP pNFS + Multi HA Pairs 解锁企业级文件存储极致性能
本文针对企业在旧内核环境(Linux 5.3 以下)无法使用 nconnect 参数导致的 NFS 性能瓶颈问题,提出基于 FSx for NetApp ONTAP Gen2 的 pNFS + Multi-HA Pairs + FlexGroup 解决方案,通过实测验证在 RHEL 7.9 (Kernel 3.10) 环境下实现显著性能提升(3倍+),无需内核升级即可满足 AI/ML、HPC 等高性能工作负载需求
AWS 一周综述:Project Rainier 上线、Amazon Nova、Amazon Bedrock 等等(2025 年 11 月 3 日)
上周,我在深圳 AWS Community Day 活动中见到了 Jeff Barr。Jeff 分享了一些 […]
RDS MySQL 8.0 版本升级指南
在这篇博文中,我们将讨论从 Amazon RDS MySQL 8.0 升级到 8.4 的实践,包括标准支持终止时间表,新版本特性变化,升级方案以及常见问题,帮助您平稳地完成数据库升级。
【Agentic AI for Data系列】开发新范式:AI驱动的数据革命(先导篇)
本文深入探讨了从”Data for AI”到”AI for Data”的范式转变,详细阐述了Agentic AI在数据开发全生命周期中的革命性应用。文章通过电商用户行为分析的实际场景,对比传统开发模式与Agentic AI驱动模式的差异,展示核心能力。同时提供了AWS AI Stack完整生态的技术选型指南。
Amazon Nova 多模态嵌入模型实战指南
本方案旨在利用Amazon自研的Nova多模态理解类模型(Vision‑Language Model,简称VLM)和多模态嵌入模型(Multimodal Embedding Model,简称MME),实现自动化的视频高光识别与剪辑。输入视频文件,通过多模态模型理解或结合语义摘要与嵌入检索实现素材定位,识别高光片段,并合成剪辑。
【Agentic AI for Data系列】Kiro实战:DuckDB vs Spark技术选型全流程
本文探讨Agentic AI在数据工程技术选型中的应用实践。针对DuckDB与Apache Spark在小文件场景下的性能差异问题,我们采用AI开发助手Kiro构建了一套系统化的性能评估框架。该框架基于AWS Glue环境,通过双重监控体系收集22+个维度的量化指标,确保测试的公平性和可重复性。
