50 秒
3000 个
100 万个
30-40 秒
减少了工程设计工作
概述
初创企业 Gan.AI 利用生成式人工智能创建具有完美音频、唇音同步和自定义视觉效果的个性化视频。自 2021 年成立以来,该公司一直在利用 Amazon Web Services(AWS),最近还实施了用于实时生成视频的 AWS 机器学习完全托管式服务。
使用带有多模型终端节点的 Amazon SageMaker 和 AWS Lambda,Gan.AI 现在能够以超低的延迟同时创建数千个视频。该企业在内部解锁了新的使用案例,并提高了现有客户的粘性。

机会 | 利用低延迟视频吸引新客户
Gan.AI 于 2021 年成立,并确立了一项雄心勃勃的使命:利用生成式人工智能(生成式 AI)普及个人视频制作。创始人希望让所有人,无论是单个房地产经纪人还是跨国企业,都能轻松创建超个性化的消息,以进行有针对性、有意义的营销。如今,即使是圣安东尼奥马刺队和孟买印度人队等运动队也在使用 Gan.AI 公司的主打产品 Studio 来提高球迷的参与度。
在最初的迭代中,Studio 受到了大型消费品牌的青睐。各个公司将提供目标接收者名单,Gan.AI 将使用这些数据为每个接收者生成自定义视频,包括个性化音频、唇音同步和视觉效果。对于每个视频,此过程最多花费 4 分钟的时间。
随后,实时视频迎来了大规模的新型自助式使用案例。Gan.AI 的首席营收官 Anupreet Singh 解释道:“我们的一些最大的客户意识到,如果他们的用户能够创建自己的视频,他们就能吸引原本对品牌参与度不高的潜在用户。对他们来说,这是开拓营销渠道并收集数据以进一步吸引潜在客户的好机会。”
Gan.AI 面临着一个挑战:他们需要显著减小创建视频时的延迟。“对于访问品牌的网站以制作视频的消费者来说,每一秒都很重要;即使等待 2 分钟也会让人难以接受,”Singh 表示。他们的生成式人工智能模型的推理能力是 Gan.AI 基础设施的主要瓶颈。该公司需要一种高效、低延迟的解决方案来扩展他们的深度学习模型。

“Amazon SageMaker 帮助我们托管了多模型终端节点,并且减小了长达 5 到 6 分钟的冷启动延迟。现在,我们可以在 30 到 40 秒钟内处理多个内容请求,而且无需完成太多的工程设计工作即可进行扩展。”
Suvrat Bhooshan
Gan.AI 的 Chief Executive Officer
解决方案 | 使用多模型终端节点加速推理
Gan.AI 多年来一直在使用 Amazon Web Services(AWS),包括将 Amazon Elastic Container Service(Amazon ECS)与 AWS Lambda 结合使用以便在 CPU 上托管他们的机器学习模型。在与他们的 AWS 客户团队讨论之后,该公司选择使用 Amazon SageMaker 为他们在 GPU 实例上的深度学习模型提供推理。特别是,使用多模型终端节点可实时提供大规模项目所需的高速度。
Gan.AI 首席执行官 Suvrat Bhooshan 说道:“Amazon SageMaker 帮助我们托管了多模型终端节点,并且减小了长达 5 到 6 分钟的冷启动延迟。现在,我们可以在 30 到 40 秒钟内处理多个内容请求,而且无需完成太多的工程设计工作即可进行扩展。”
Gan.AI 花费了将近三个月的时间进行测试,对于在此过程中遇到的每一次挑战,AWS 都提供了帮助。例如,当团队需要确保快速、自动扩缩多模型终端节点时,AWS 提供了架构指导,以使单个 GPU 实例能够同时处理最多五个请求,并在几秒钟内做出响应。Gan.AI 通常部署 8 到 10 个始终运行的实例,而且这一数量可以在必要时扩展到大约 200 个实例。
Bhooshan 建议:“在实施之前,Amazon SageMaker 的新用户应当全面测试和试验它的各种功能和不同的 GPU 实例类型。”“例如,我们发现将非 GPU 进程分流到 AWS Lambda 可以更高效地利用 Amazon SageMaker 资源。当在像我们这样混合使用深度学习和 CPU 密集型工作负载的企业中进行扩展时,这种做法特别有用。”
成果 | 同时扩展数百个生成式人工智能模型
Gan.AI 现在可以同时推理和扩展数百个具有超低延迟的自定义生成式人工智能模型。由于最多 3000 名最终用户可以同时在不到一分钟的时间内生成自定义视频,因此 Gan.AI 框架能够在短短的 3 小时内制作 100 万个独特的视频。作为他们的实时产品的一部分,Gan.AI 还为品牌提供了具有自定义音频功能的实时聊天机器人。
全球各地的公司都在使用 Gan.AI Studio 来创建个性化和创新的客户参与活动。例如,Agoda 与 Gan.AI 合作开发了一个以印度演员兼歌手 Ayushmann Khurrana 为主角的个性化前置式 YouTube 广告活动。Agoda 利用 Studio 制作了 200 多个 20 秒的广告,在这些广告中,Ayushmann 利用为观众梦寐以求的度假胜地量身定制的消息,直接与观众们互动。此次活动收获了 1 亿多次展示和 1000 万次观看,品牌知名度提高了 2.5 倍。
Agoda 的印度市场品牌主管 Sahil Sharma 表示:“Agoda 的人工智能活动利用 Gan.AI 的语音生成、唇音同步和图像个性化技术,将大规模的个性化提升到了新的水平。Gan.AI 的技术不仅能够实现高质量、快速的结果,还为包括在线旅行社在内的各类生成式人工智能用途树立了新的标杆。”
对 Gan.AI 而言,实时视频功能为品牌解锁了新的收入机会,从而提高了客户群的粘性。该公司目前正在评估其他垂直行业是否能够采用他们的解决方案,并将继续与 AWS 合作开展新的项目以发展业务。这些项目包括创新开发,例如 Avatar Zero Shot Models,这些模型采用了文本转语音和语音克隆技术,可通过同步的唇部动作复制人类的讲话方式,还采用了对话式人工智能平台,以提供自然、引人入胜的用户互动。
了解详情
要了解更多信息,请访问 aws.amazon.com/ai/generative-ai。
关于 Gan.AI
Gan.AI 是一家软件提供商,致力于利用生成式人工智能创建具有完美语音和唇音同步的实时个性化视频。全球大型和小型企业都在利用 Gan.AI 生成数百万个高度自定义的视频,从而提高品牌参与度和转化率。
使用的 AWS 服务
行动起来
无论行业无论规模,每天都有各种机构在使用 AWS 实现自身业务转型、实现企业愿景。欢迎您联系我们的专家,立即踏上您的 AWS 之旅。