亚马逊AWS官方博客

Category: Artificial Intelligence

使用 Rolling Batch 加速 SageMaker LLM 模型推理性能

本文介绍了近期业界新的 Rolling Batch(continually batch)的批处理推理优化技术原理,并给出了在 Amazon SageMaker 上使用 vLLM 框架进行 Rolling Batch 推理优化的实践和测试对比,可以帮助客户在实际生产场景中通过简单配置,立竿见影地提升线上部署的 LLM 的推理吞吐量,降低响应时延,节省资源。

2023 英雄联盟全球总决赛直播引入电竞实时胜率分析

2023 年 10 月 19 日,全球热度最高的电子竞技赛事“2023 英雄联盟全球总决赛”即将隆重开赛,JDG、LNG 等中国战队即将迎战 Fnatic、KT 等世界强队。AWS 游戏行业团队和重要客户:拳头游戏一起,为这个重要的赛事打造了一个基于机器学习服务的可视化实时电竞胜率数据分析服务,帮助赛事观众和解说员深入理解比赛,追踪战队状态。

Stable Diffusion Quick Kit 动手实践 – 在 SageMaker Training Job 上进行 SDXL Dreambooth 训练并推理

本文是 Stable Diffusion Quick Kit 系列博客的一部分,介绍如何在 SageMaker Training Job 中加载进行 Stable Diffusion XL(以下简称SDXL)的 Dreambooth 微调训练,及训练完成后使用 Stable Diffusion WebUI 开源框架进行模型部署和即时推理,实现训推一体的整体 pipeline 及业务流程。