亚马逊AWS官方博客
互联网性能观测系列之二 – 时序直方图的使用
本文介绍了时序直方图:通过在直方图基础上加入时间维度,展现了性能指标数据分布在时间上的变化,让观察者可以获取到新的洞察。并提供了展示效果和参考代码。
结合 HSDP 及模型并行加速 Llama3 训练
本文分析模型并行库 SMPv2,其结合了PyTorch HSDP 和 Nvidia Transformer Engine,实现了基于张量并行的大型模型训练。SMPv2 在 SageMaker 体系上简化了繁琐的训练初始化配置,并支持与 PyTorch FSDP 的无缝集成,极大降低了开发复杂性。通过配置层次化分片、张量并行度等参数,SMPv2 可以在 Amazon P5 等高性能实例上实现高效的集群扩展性能,同时有效降低显存消耗,支持高效的大型基础模型训练。
适用于 Lustre 的 Amazon FSx 可将 GPU 实例的吞吐量提升高达 15 倍
现在,我们宣布在 适用于 Lustre 的 Amazon FSx 上支持 Elastic Fabric Ada […]
浅谈数据库连接池优化之 Amazon ElastiCache Redis
本文主要介绍 Amazon ElastiCache Redis 数据库连接池优化技巧,通过使用 Redisso […]
借助开源大模型微调打造行业定制化专业翻译
在全球化的商业环境中,高质量的专业翻译对于企业出海和行业交流至关重要。然而,专业领域的翻译往往面临着术语精确性、行业特定风格表达和文化适应性等多重挑战。 本文将探讨如何利用开源大语言模型的微调技术来解决这些挑战。通过针对性的微调训练,我们可以显著提升模型在特定行业翻译任务中的表现。
云上自动化创建账户实践
自动化账户创建的逻辑、前端集成以及账户创建后的自动化检查流程。
Amazon EBS 现支持创建基于时间的快照副本
现在,当您在 AWS 区域和/或账户内或之间复制 Amazon Elastic Block Store (Am […]
Amazon EC2 现支持至多提前 120 天的按需容量预留
客户使用 Amazon Elastic Compute Cloud(Amazon EC2)来运行所有可以想象的 […]
满足合规,构建经济灵活的 RDS MySQL 审计日志系统
满足网络安全法,构建经济灵活的 RDS MySQL 审计日志系统
AWS 一周综述:197 项新发布;与 Anthropic 建立人工智能培训合作伙伴关系;以线上方式参与 AWS re:Invent(2024 年 11 月 25 日)
上周,我看到 AWS 新发布的服务数量达到了惊人的 197 项。这意味着我们离 AWS re:Invent 2 […]