亚马逊AWS官方博客
Category: Artificial Intelligence
使用 WebRTC 构建实时 AI 助手
本文将会介绍使用 WebRTC 构建实时 AI 助手的整体架构方案,并且以 LiveKit WebRTC 为例,介绍如何构建基于 WebRTC 的 AI 实时翻译助手(Agent)。
有家更有 AI – 基于 Amazon Bedrock、Agents、Rekognition 构建智能家居安防方案
基于这一背景,本案例中使用 Anthropic Claude 3.5 Sonnet 大模型的多模态能力,结合亚马逊云科技的托管图像识别服务 Rekognition,搭建了家居环境安全监控的解决方案,探索 AI 技术在智能家居领域的应用前景。该方案融合了计算机视觉、模式识别、图像处理等多种人工智能技术,具备火灾监测、人脸识别、图像与视频分析等核心功能。一旦发现异常火情,系统能够立即启动报警机制,通过电话、短信、邮件等方式给用户发送通知;同时,此方案也支持对人员的面部图像进行验证,有效防止外来者的非法闯入。
ComfyUI 集成 Stable Diffusion 3 在亚马逊云科技的典型使用场景介绍
本文将 SD3 在 AWS 的主要使用方式做了总结,并针对性的提出其适用场景。
大语言模型工程化:挑战与解决方案
本文通过一个企业翻译应用案例,全面阐述了大语言模型应用从构思到上线的完整过程。文章讨论了业务场景发现与目标设定的重要性,分析了翻译应用面临的主要挑战,如专有名词翻译、长文本处理、翻译风格、准确度提升等。针对这些挑战,文章提出了使用定制模型、自省机制、专有词表、长文本拆解等解决方案。此外,还探讨了安全合规、部署策略、模型评估、用户反馈等重要考虑因素。最后,文章勾勒出一个通用的大语言模型应用架构,为企业构建和部署大语言模型应用提供了全面的参考框架。
逆向图灵,借助生成式 AI 技术打造激动人心的 Role-play 游戏智能 NPC:ChatArena-Plus 解决方案
随着人工智能技术的快速发展,游戏行业正面临着一个激动人心的机遇:利用生成式 AI 来创造更加智能、动态和个性化的 NPC。传统的 NPC 往往存在行为模式固定、对话有限等问题,难以为玩家提供真实而丰富的互动体验。而借助先进的语言模型和多智能体系统,我们可以打造出具有动态对话生成、独特个性、NPC 间互动博弈等特点的新一代 NPC。
Amazon SageMaker TF 2 分布式训练方案
本文将总结分享客户从 TF 1.15 迁移升级到 TF 2.14 过程中遇到的一些问题及应对方法,并以一个简单的例子给出基于 TF 2 的分布式训练代码。
垂直电商图像搜索再升级:DINO 模型带来精准匹配体验
本文通过使用服装鞋类商品进行模型训练,同时通过 GroundingDINO 进行目标物品检测和剪切的方式对图片进行搜索,这种方式满足企业级的,特别是垂直行业的高精度搜索。有助于更好地提升用户的搜索体验。 该方案也可以拓展到其他的垂直行业使用,如电商、游戏、短视频,医疗、制造业等。
摆脱 GPU 资源束缚,Amazon Inf2 让大模型推理更高效
亚马逊自研芯片 inf2 与 vLLM 助力企业高效部署大型语言模型。
基于 Amazon Bedrock 构建端到端实时语音助手
本文使用 Amazon Bedrock、Transcribe 和 Polly,结合开源 ASTRA 框架,开发了一个高效的实时语音助手,并提供常规聊天及同声传译两个工作模式。
使用 AWS Console-to-Code 控制台转代码功能(现已正式发布)将 AWS 管理控制台操作转换为可重复使用的代码
今天,我们宣布推出 AWS Console-to-Code 控制台转代码功能正式发布版本(GA),该功能可以轻 […]