亚马逊AWS官方博客

利用 Amazon EC2 P5 Spot 实例进行 LLM 的微调任务

介绍了启动和管理 P5 Spot 实例的方法,P5 实例是亚马逊最新的机器学习训练机型,有强大的性能和显存容量,可以更好地支持 LLM 的微调任务。开发者可以参考文中提供的 AWS CLI 命令,根据自身需求,开发完整 Spot 管理系统,利用 EC2 P5 Spot 实例完成低成本高算力的机器学习任务。

Amazon Aurora MySQL 版本 2(兼容 MySQL 5.7)升级到版本 3(兼容 MySQL 8.0)检查清单,第 1 部分

Amazon Aurora MySQL 兼容版版本 2(兼容 MySQL 5.7)计划于 2024 年 10 月 31 日终止标准支持。我们建议您在 2024 年 10 月 31 日之前,尽早将数据库升级到 Amazon Aurora MySQL 3 的默认次要版本或更高版本。在这篇博文中,我们将讨论导致升级和升级预检查失败的最常见原因。这些问题需要在执行升级之前加以解决。

在 Amazon SageMaker HyperPod 上使用 LLaMA-Factory 轻松微调大模型

LLaMA-Factory 是开源社区一套大模型集成训练框架,AWS SageMaker 是亚马逊云服务中的一个全面的机器学习平台,它提供了一种简单、高效的方式来构建、训练和部署机器学习模型。 本文中我们将结合代码和示例介绍如何使用 LLaMA-Factory 在 SageMaker HyperPod 上训练大模型,熟悉 SageMaker HyperPod 集群创建和多机多卡分布式训练方法。

升级至 Amazon Aurora MySQL 版本 3(兼容 MySQL 8.0)

Amazon Aurora MySQL 兼容版版本 3(兼容 MySQL 8.0)是 Amazon Aurora MySQL 支持的最新主要版本。在这篇博文中,我们将讨论一个框架,供您为升级做准备,查看标准支持终止时间表,然后深入探讨升级过程。本文还介绍了在升级生产数据库集群之前,执行性能测试的最佳实践、实时监控所做更改的技巧以及其他关键注意事项。