[SEO 副标题]
本指南演示了如何通过自动提取视频元数据、情报收集和内容审核来加快内容分析工作流程。它使您能够高效地处理大量视频内容,提取有价值的见解,并通过可自定义的策略评估做出数据驱动型决策。通过将这些传统的手动任务自动化,您可以降低运营成本、提高准确性并扩展内容分析能力,同时保持安全可靠的运营。
请注意:[免责声明]
架构图

-
提取通用元数据
-
提取服务的 Restful API
-
提取通用元数据
-
此架构图显示了如何使用生成式人工智能从视频中提取通用元数据,并演示了动态策略评估分析。
第 1 步
媒体分析师通过 Amazon CloudFront 分发访问前端静态网站。静态内容托管在 Amazon Simple Storage Service(Amazon S3)上。第 2 步
用户通过 Amazon Cognito 用户池的身份验证登录前端 Web 应用程序。第 3 步
用户使用由 UI 应用程序管理的分段预签名的 Amazon S3 URL,直接从浏览器将视频上传到 Amazon S3。
第 4 步
前端 UI 通过 Amazon API Gateway 提供的 RESTful 接口与提取服务(微服务)进行交互。该接口提供创建、读取、更新和删除(CRUD)功能,用于视频任务提取和管理。提取服务可以独立于其他组件进行部署和使用。第 5 步
AWS Step Functions 状态机负责监督分析过程。它使用 Amazon Transcribe 转录音频,使用 moviepy 对视频中的图像帧进行采样,在 Amazon Bedrock 上使用多模态模型分析图像,并使用 Amazon Rekognition 获得更多见解。它还会在帧级别生成文本和多模态嵌入。用户可以自定义本指南中的逻辑,以集成其首选的生成式人工智能模型。第 6 步
Amazon DynamoDB 以文本格式存储媒体处理任务元数据和提取的视频信息。Amazon OpenSearch Service 集群存储向量嵌入并满足搜索和发现需求。第 7 步
用户使用解决方案 UI 选择和自定义现有模板提示,然后根据提取的视频元数据使用 Amazon Bedrock 大型语言模型(LLM)启动策略评估。
-
提取服务的 Restful API
-
此架构图展示了通过 Amazon API Gateway 提供的提取服务的关键 RESTful API。UI 使用 API 检索数据,允许用户将提取服务集成到现有工作流程中。
第 1 步
/start_task 端点是提取服务的核心,用于管理视频元数据提取过程并维护结果。
第 2 步
DynamoDB 存储提取的元数据。生成式人工智能模型的原始结果以 JSON 或文本文件形式保存在 Amazon S3 中。Amazon OpenSearch Service 索引将存储帧级别嵌入以提供搜索服务。第 3 步
该过程包括调用 Amazon Transcribe 以生成音频转录、按指定的时间间隔对视频中的图像帧进行采样,以及通过生成多模态嵌入和应用相似度比较来删除相似帧。对于每个图像帧,该服务应用人工智能或生成式人工智能功能来提取元数据。此外,该服务还会为每个帧生成文本和多模态嵌入以启用向量搜索功能。
第 4 步
Amazon Simple Notification Service(Amazon SNS)会通知下游工作流程任务已完成。第 5 步
/get_task 端点使用唯一的任务 ID 来检索视频任务信息。数据是从 DynamoDB 表中获取的。
第 6 步
/delete_task 端点使用唯一的任务 ID 删除视频任务。它将从 DynamoDB 表、Amazon S3 和 Amazon OpenSearch 索引中删除所有与任务相关的状态。
第 7 步
/search_task 端点搜索符合所提供条件的任务。它支持根据 DynamoDB 任务名称和描述进行关键字搜索,以及使用 Amazon OpenSearch 向量索引进行语义和多模态嵌入搜索。
Well-Architected 支柱

当您在云中构建系统时,AWS Well-Architected Framework 可以帮助您了解所做决策的利弊。框架的六大支柱使您能够学习设计和操作可靠、安全、高效、经济高效且可持续的系统的架构最佳实践。使用 AWS 管理控制台中免费提供的 AWS Well-Architected Tool,您可以通过回答每个支柱的一组问题,根据这些最佳实践来检查您的工作负载。
上面的架构图是按照 Well-Architected 最佳实践创建的解决方案示例。要做到完全的良好架构,您应该遵循尽可能多的 Well-Architected 最佳实践。
-
卓越运营
Amazon CloudWatch 为在 AWS Lambda 和 Step Functions 中运行的服务提供日志记录和见解。 本指南在各个阶段将指标推送到 CloudWatch,以提供 Lambda 函数、AI/ML 服务和 S3 存储桶等基础设施的可观测性。
-
安全性
本指南实施最低权限 AWS Identity and Access Management 策略,并使用 AWS Key Management Service(AWS KMS)密钥加密 S3 数据。通过 Amazon Cognito 处理用户身份验证,使用 OAuth 模式进行 Web 应用程序登录和 API 网关调用。OpenSearch 服务集群部署在 Amazon Virtual Private Cloud(Amazon VPC)私有子网中,只有经授权的 Lambda 函数才能访问。
-
可靠性
Amazon S3 通过版本控制、防止删除和跨区域复制功能提供强大的数据管理。API 网关、Lambda、Step Functions 和 Amazon Simple Queue Service(Amazon SQS)等无服务器服务提供内置的可扩展性和高可用性。OpenSearch Service 部署通过多个可用区支持高可用性,其特点是具有复制分片的冗余数据节点,有助于确保数据的持久性和恢复能力。
-
性能效率
Lambda 和 Step Functions 通过并行执行函数和工作流程步骤实现高效的并行处理。这种并行处理能力提高了总体吞吐量并缩短了执行时间。无服务器架构可自动处理在 AWS 上扩展工作负载的复杂性,从而为媒体处理任务提供最佳性能。
-
成本优化
Amazon S3 存储类和生命周期策略可优化视频存储成本,而无服务器和 AI/ML 服务则采用即用即付模式,这意味着您只需为使用的服务付费。事件驱动型架构有助于确保仅对实际使用的资源收费,使您能够经济高效地配置和定制媒体工作流程,同时使用 S3 生命周期策略存储和归档摄取的内容、代理和元数据。
-
可持续性
AWS 无服务器服务和 AI/ML 组件可根据需求动态分配计算资源,从而消除过度配置并减少资源浪费。与传统的本地服务器相比,这种方法最大限度地降低了能耗,同时最大限度地提高了 AWS 人工智能服务的效率,从而减少后端操作对环境的影响。
免责声明
示例代码;软件库;命令行工具;概念验证;模板;或其他相关技术(包括由我方人员提供的任何前述项)作为 AWS 内容按照《AWS 客户协议》或您与 AWS 之间的相关书面协议(以适用者为准)向您提供。您不应将这些 AWS 内容用在您的生产账户中,或用于生产或其他关键数据。您负责根据特定质量控制规程和标准测试、保护和优化 AWS 内容,例如示例代码,以使其适合生产级应用。部署 AWS 内容可能会因创建或使用 AWS 可收费资源(例如,运行 Amazon EC2 实例或使用 Amazon S3 存储)而产生 AWS 费用。
本指南中提及第三方服务或组织并不意味着 Amazon 或 AWS 与第三方之间存在认可、赞助或从属关系。AWS 的指南是一个技术起点,您可以在部署架构时自定义与第三方服务的集成。