亚马逊AWS官方博客
构建一站式车联网数据分析平台
本文介绍了围绕 Amazon EMR 和统一数据湖(S3)在构建车联网数据平台的实践,用户无需在不同数据分析引擎之间移动数据,通过 Amazon EMR 让开发人员可以继续沿用以往在 hadoop 生态体系下的数据平台的操作习惯,实现细粒度的数据权限和身份认证控制,另外针对车联网数据具有实时性、数据流量存在波峰波谷不确定等特性,利用亚马逊云科技 Serverless 服务的优势,在通过弹性资源优化资源利用率,也可以快速完成整个车联网数据平台架构的验证与运营,为助力车企向“服务和数据驱动”转型变革保驾护航。
Amazon SageMaker TF 2 分布式训练方案
本文将总结分享客户从 TF 1.15 迁移升级到 TF 2.14 过程中遇到的一些问题及应对方法,并以一个简单的例子给出基于 TF 2 的分布式训练代码。
使用 Amazon CodeCatalyst 跨账号和区域部署 EKS 应用
Amazon CodeCatalyst(于 2023 年 4 月 20 日正式发布)是一个一站式 DevOps 服务,通过本文你将了解到如何使用 Amazon CodeCatalyst 跨账号和区域部署 EKS 应用。
骏书千里:社交实时聊天消息在云上的数据库设计
社交实时聊天消息的数据库,需要兼顾高性能与持久化,可以使用 Amazon DynamoDB,在保证数据持久化的同时,海量请求下仍然能达到毫秒级别的响应速度。
利用 Apache Celeborn 减少 AWS EMR 集群中 Spot 实例回收导致的重算成本
Celeborn 是一个开源的实现 Remote Shuffle 的工具。通过为 EMR 部署 Celeborn 服务,可以将 Spark 计算的中间结果从采用 Spot 实例的 EMR 集群节点中分离存储,实现 shuffle 数据的存算分离,有效减少了 Spot 实例回收导致的重算成本。
垂直电商图像搜索再升级:DINO 模型带来精准匹配体验
本文通过使用服装鞋类商品进行模型训练,同时通过 GroundingDINO 进行目标物品检测和剪切的方式对图片进行搜索,这种方式满足企业级的,特别是垂直行业的高精度搜索。有助于更好地提升用户的搜索体验。 该方案也可以拓展到其他的垂直行业使用,如电商、游戏、短视频,医疗、制造业等。
摆脱 GPU 资源束缚,Amazon Inf2 让大模型推理更高效
亚马逊自研芯片 inf2 与 vLLM 助力企业高效部署大型语言模型。
Direct Connect 零中断切换方案
Direct Connect 零中断切换方案,在实现 DX 扩容时无缝替换,在类似场景,例如专线更换、专线扩容替换、VGW 替换、TGW 替换等需求下,均可采用相同思路。
Amazon DocumentDB 之中文检索
通过 Amazon DocumentDB 与开源组件的集成,增强了 DocumentDB 中的中文检索能力
Amazon Lambda 函数配置动态更新方案分析
本文将在“从 Amazon Lambda 主动向配置中心查询配置”的基础上,分析不同配置更新方案的优缺点,以便您在架构设计时进行选择。