亚马逊AWS官方博客

Category: Artificial Intelligence

基于亚马逊云科技 AI 服务打造多模态智能化内容审核

本文将探讨如何使用亚马逊云科技提供的一系列托管人工智能服务 Amazon Rekognition,Amazon Comprehend,Amazon Transcribe 和 Amazon Bedrock 以及其他技术,打造自动化的智能化内容审核系统包括图像、视频、文本和音频审核工作流程,及时过滤不合适的内容,给用户带来更好的体验。

利用 Amazon Bedrock 和 Amazon EKS 构建多租户的基于 RAG 的聊天机器人

随着生成式人工智能模型的出现,许多客户都在探索如何构建聊天机器人应用,以满足其终端客户的各种需求,这包括了既要让每个聊天机器人都能专门处理特定租户的上下文信息,又要能利用其开发团队熟悉的经济高效的基础设施大规模运行此类多租户应用程序。

高性能大规模机器学习分布式训练 – EFA(Elastic Fabric Adapter)最佳实践

大语言模型 LLM 和生成式人工智能进一步推动了新一代机器学习的大规模普及和应用,同时也有越来越多的团队选择构建自己的大(语言)模型,以实现更好的生成效果。但是,高效地训练这些包含数十亿甚至数千亿参数的模型是一个非常大的挑战,因为模型越大,理论上所需要的计算资源就越多,如何设计一个高性能的基础设施来支持这些密集型的分布式工作负载,已经成为一个关键性的问题。为了解决这个难题,在亚马逊云科技平台上可以使用面向大规模机器学习(以及高性能计算 HPC)场景下的 Elastic Fabric Adapter(下文称 EFA),它是一种 Amazon EC2 实例上创新的网络接口,可以显著提高机器学习和高性能计算应用程序的网络性能。

云端生成式 AI – 基于 Amazon EKS 的 Stable Diffusion 图像生成方案

在生成式 AI 的图像生成场景下,我们基于 Amazon EKS,实现了一种更加适合 toC 场景的解决方案,它将帮助客户从容应对大并发量的请求,达到分钟级冷启动;使用更简单的控制平面,为客户提供更灵活的架构,轻松实现各种功能模块设计;同时,它还利用 Amazon Spot instances,帮助客户有效控制成本。