亚马逊AWS官方博客

Category: Artificial Intelligence

利用 Elastic File System 加速 Stable Diffusion WebUI 部署推理

面对在容器化环境中进行 Stable Diffusion WebUI 的部署,容器镜像往往高达几十 GB,在进行模型部署时,往往需要等待 15~20 分钟才能部署一套文生图、图生图的 AI 应用。有时候我们不得不采用提前预置 GPU 实例,以满足实时或近实时推理的需求,这就提升了 Stable Diffusion WebUI 的成本。此方案是通过利用 EFS 共享文件系统来加速 Stable Diffusion WebUI 部署推理。通过实验可以观察到有数倍的部署加速效果,特别适用于企业级客户对文生图推理应用的场景。

《基于智能搜索和大模型打造企业下一代知识库》之《制造/金融/教育/医疗行业实战场景》

本篇将继续下沉到具体行业进行场景以及实施案例的介绍。1)通用场景:基于企业内部知识库例如IT/HR信息的问答2)制造行业:装备维保知识库问答和售后客服 3)金融行业:智能客服和智能报告生成 4)教育行业:面向学生和面向学校的智能问答机器人 5)医疗行业:医疗论文论文信息检索。