亚马逊AWS官方博客
增强Amazon EKS 节点自愈方案:基于 NPD 的故障持久化与安全修复探索
本文介绍了 npd-node-replace 组件的整体架构与实现原理,重点阐述了如何基于该组件对节点问题事件进行采集与分析,并对异常节点状态进行自动化处理。通过对节点异常场景的自动修复机制进行方案设计与实践探索,提升集群的可用性与整体稳定性。
如何在中国区使用 Amazon CloudFormation 堆栈集批量管理多账号 Amazon Backup备份计划
本篇文章主要介绍了如何结合Amazon CloudFormation的堆栈集功能实现Amazon Backup计划的统一部署及后续管理。用户可以创建一份通用的备份计划模板,然后通过Amazon CloudFormation控制台为特定账号列表或整个组织、特定OU批量部署相同的备份计划。如后续备份计划有调整,也可通过在堆栈集中更换模板的方式更新所有账户下的备份计划。
JoyCastle 素材资产智能化之路:基于 Amazon Nova Multimodal Embeddings 的广告素材管理实践
随着业务的全球化扩展,JoyCastle 面临一个共性挑战:如何高效管理和检索海量广告素材,让创意团队从重复劳动中解放出来,聚焦于真正的创意产出。 在与亚马逊云科技游戏行业解决方案团队的深度合作中,JoyCastle 基于 Amazon Nova Multimodal Embeddings 构建了智能化的素材资产管理系统,实现了从传统人工标签到 AI 语义搜索的跨越。
使用 Amazon GameLift Servers为游戏构建 DDoS 防护与延迟优化
多人在线游戏面临两大网络挑战——DDoS 攻击和跨区域延迟。本文介绍 Amazon GameLift Servers 新推出的 Player Gateway(玩家网关)和 Ping Beacons(延迟探测)功能,并通过开源的 C++ Client SDK 和完整的 Sample App,手把手演示如何集成这两项能力,包括使用 AWS CDK 一键部署基础设施、对比中继模式与直连模式的差异
Amazon CloudFront部署小指南(二十四):将CloudFront “多域名”改造为”多租户”架构
通过多租户架构简化 CloudFront 配置管理
将 Florence-2 部署到 Inferentia2 的实战指南
本文以 Florence-2 为例,通过 Stage-wise 编译、Bucket 策略和 BF16 优化解决适配难题,实现 252ms 延迟、8.18 QPS,推理成本较 GPU 降低 38%。
以Kiro快速部署云上Agent:只需几个小时,从业务需求到部署于Amazon Bedrock Agentcore落地
使用Kiro AI IDE开发工具,快速实现各种业务Agent。从业务需求,到开发测试,到云上部署,整个过程缩短到几个小时。Amazon Bedrock Agentcore的免运维、安全隔离和扩展性,结合记忆、认证、安全策略、可观测性、评估等组件,更适合生产级别Agent大规模部署。
Claude Code 接入自建开源模型:企业私有化与降本实践
企业使用 Claude Code 面临代码安全和成本压力双重挑战。本文介绍一套完整的解决方案:通过在 AWS SageMaker 上部署 Kimi/GLM 等开源模型,结合 LiteLLM Proxy实现智能路由,将支线任务分流到私有化模型处理。实测数据显示,单台 H200 部署成本约 $1000/天,相比等效 Claude API 调用成本降低约 70%,性价比提升 3.2倍。文章详细讲解架构设计、部署流程、动态路由策略及流式响应适配,提供可落地的企业级私有化方案
基于 Amazon CloudFront 和 Lambda@Edge 实现失败请求的完整记录与异步重放
本文介绍了一种基于 Amazon CloudFront 双 Lambda@Edge的架构方案,在不修改源站代码的前提下,完整记录被 WAF 拦截及源站返回错误的请求(含 headers 和 body),并通过 CloudWatch Logs + Kinesis Data Firehose 汇聚至 S3,支持异步补数重放。
利用AWS Firewall Manager统一部署Network Firewall (一)分布式架构
本文中主要介绍通过AWS Firewall Manager为用户集中创建管理多账号下的分布式Network Firewall部署。