亚马逊AWS官方博客

Category: Application Integration

使用 Rolling Batch 加速 SageMaker LLM 模型推理性能

本文介绍了近期业界新的 Rolling Batch(continually batch)的批处理推理优化技术原理,并给出了在 Amazon SageMaker 上使用 vLLM 框架进行 Rolling Batch 推理优化的实践和测试对比,可以帮助客户在实际生产场景中通过简单配置,立竿见影地提升线上部署的 LLM 的推理吞吐量,降低响应时延,节省资源。

一种使用 AWS 云原生服务部署高可用 APACHE AIRFLOW 集群的方案

对于需要在 AWS 上使用 Apache Airflow 但是 无法使用 AWS 托管服务 MWAA , 或者想使用特定 Apache Airflow 版本, 或者想定制 Apache Airflow 登陆、部署方式的用户,可以通过此方案搭建高可靠的 Apache Airflow 集群,同时提供用户登陆和鉴权机制。此方案已在全球知名 Tier One 汽车供应商的高级辅助驾驶系统(Advanced driver-assistance system, ADAS)开发平台成功应用。

Amazon SES邮件备用方案初探

为了方便云上企业应用向企业内部或者合作伙伴的随机收件人发送邮件通知,本文探讨一种SES邮件服务的备用方案(Workaround Solution),使用亚马逊云科技无服务器化(Serverless)的Amazon Simple Queue Service (SQS)与AWS Lambda服务,结合使用企业自有的SMTP服务器中继完成发送邮件通知的功能