亚马逊AWS官方博客
低延迟实时语音识别(ASR)模型部署实践与选型
本文选取 Whisper Large‑v3 Turbo、Voxtral Mini 与 NVIDIA Parakeet 三个代表性小参数模型,在统一的 NVIDIA GPU + SageMaker Real‑time 端点 技术栈上完成了可复现的部署与基准测试:包括 JumpStart 一键部署、BYOC 自定义镜像、端点调用 payload 示范,以及对不同音频长度和并发条件下的延迟与吞吐进行量化对比。
道通与亚马逊云科技联合推动充电运营全面进入智能化时代
本文介绍了道通科技(Autel)与亚马逊云科技(AWS)的深度合作实践。双方基于AWS云原生架构、Amazon Bedrock生成式AI能力及Strands Agents SDK,在道通CSMS平台上构建了业界首批落地的AI智能员工矩阵(AI Intelligence Employees)。
使用Logstash在线迁移 Amazon OpenSearch Service
ElasticSearch/OpenSearch虽然支持快照还原的方式来迁移集群,但由于本身没有binlog/changelog之类的机制,在线迁移难度较大。本文介绍了一种基于Logstash实现OpenSearch/ElasticSearch集群在线迁移的方案,该方案可以实现较低停机时间的数据迁移。
不只是 Chatbot:如何设计一个真正可执行的 Agentic Commerce 电商系统
本文将结合行业趋势(ACP-Agentic Commerce Protocol / UCP-Universal Commerce Protocol / Rufus等平台整合路径),并通过一个可运行的原型系统,探讨 Agentic Commerce 作为一种系统能力,应该如何被设计、实现与验证。
使用 Karpenter 和 HAMi 实现 GPU 分片和动态扩缩容
本文将介绍如何结合Karpenter 和HAMi(Heterogeneous AI Computing Virtualization Middleware)来实现 GPU 资源的细粒度分片和自动扩缩容
基于Flux on G6e和 S3 Vector 的Icon 图片生成方案
本文将介绍如何基于Flux on G6e 和S3 Vector 构建一个具有高性价比的icon图片生成与检索方案,返回s3 url 用于满足智能UI设计中HTML或H5界面的Icon需求。相比于直接调用Flux API,该方案在ToC生产环境中具有成本优势。
从手动到智能:用 Kiro CLI + OpenSearch MCP 让每个人都成为 OpenSearch 专家
OpenSearch 已成为企业构建搜索和分析解决方案的重要选择,但其使用面临着双重挑战:运维层面需要应对复杂的集群配置、索引管理和性能调优;应用层面则需要深入理解查询语法和底层机制才能高效提取数据价值。为了降低使用门槛,我们引入了 Kiro CLI + OpenSearch MCP Server 的创新组合,通过 AI Agent 的能力简化运维管理并加速搜索分析应用的开发和优化。
三剑合璧Quick Suite + Agent Core + Kiro联动实践:海外物流报价助手实战
随着跨境电商业务的快速增长,海外仓库每周需要处理大量的物流报价查询请求。对部门运营效率提出挑战,目前的工作方式是以传统的Excel表格查询方式,时效和准确度都难以保障。希望能够借由AI提升效率和准确度,同时又自主快速迭代。
在 Amazon SageMaker 上部署 Fast-Whisper:Async endpoint推理部署实践总结
本文围绕“将 Fast-Whisper 以 BYOC 方式托管到 Amazon SageMaker 推理端点”展开,系统给出从本地构建 GPU 推理镜像、推送 ECR、创建 Model/Endpoint Configuration,到部署Async Endpoint 的完整流程。
Amazon Nova Lite Fine-Tuning: 高性价比的视觉检测模型微调案例与实践
本文介绍了在 Amazon Bedrock 上对 Amazon Nova Lite 1.0进行微调的两个实际应用案例,展示了在专业计算机视觉任务中如何在保持成本效益的同时实现显著的性能提升。通过对航拍视角检测和低光照监控场景的系统性评估,我们以最小的训练成本实现了增强的指令遵循能力和更高的检测准确率。