- AWS 解决方案库›
- AWS 媒体超级分辨率指南
AWS 媒体超级分辨率指南
机器学习助力视频分辨率提升
概览
工作原理
这些技术细节包含一张架构图,用于说明如何有效构建本解决方案。该架构图展示了关键组件及其相互作用,并逐步概述了架构的结构和功能。
Well-Architected 支柱
上面的架构图是按照 Well-Architected 最佳实践创建的解决方案示例。要做到完全的良好架构,您应该遵循尽可能多的 Well-Architected 最佳实践。
本指南通过视频提质管道中端到端的可见性和可扩展式自动化,满足您的运营需求。例如,Amazon CloudWatch 指标和 DynamoDB 任务跟踪可提供流程监督,以监控性能、帮助您发现问题和排除根本原因。Lambda 可实现自动化且零停机时间的部署,因此基础设施更新可以无缝进行,无需人工操作。此外,ParallelCluster 使用基础设施即代码(IaC)实现跨环境的一致化基础设施自动配置,从而简化变更控制工作。最后,Amazon Elastic Container Registry(Amazon ECR)集中了机器学习(ML)模型容器,便于使用统一的脚本进行大规模推理部署。
强大的安全保护覆盖整个工作流程,同时简化了访问控制。输入和输出 Amazon S3 存储桶使用预签名的 URL 或 AWS Identity and Access Management(IAM)角色来授予临时访问权限,从而锁定数据。经过身份验证的用户通过 Amazon Cognito 连接到私有 ALB。ParallelCluster 将机器学习推理封锁在隔离的 VPC 内,只能通过 Systems Manager 进行访问。此外,管理员可以通过 VPC 安全组来限制对适用于 Lustre 的 FSx 文件系统的访问权限,并且可以通过 AWS KMS 对数据进行加密。最后,AWS CloudTrail 集中管理活动日志,实现审计可见性。
由弹性负载均衡(ELB)、Fargate 和 DynamoDB 提供的无服务器前端架构在区域内提供高可用性。而且,您可以在多个可用区(AZ)以高可用性方式部署转码和机器学习计算节点。您还可在多个可用区中将 Slurm 控制器按主模式或辅助模式部署,以提高故障恢复能力。适用于 Lustre 的 FSx 文件系统将数据存储在成本优化的存储空间中,适用于转码等短期、流程繁琐的工作负载。不过,源材料和最终材料都存储在 Amazon S3 中以增强其持久性。
本指南通过使用 ParallelCluster 实现可扩展的性能效率,自动扩展 GPU 资源以满足动态批处理需求,避免过度配置成本。即时工作分配功能在异构集群中智能分配视频工作流程,进一步优化了基础设施的实用性。 Lambda 函数可扩展视频帧提取的调用次数,而预置的并发性保证了低延迟响应。最后,在整个集群中使用共享的适用于 Lustre 的 FSx 文件系统,为单个视频帧提供低延迟的读取和/或写入访问。
该指南使用的是事件驱动型架构,只有在需要时才会消耗计算和网络资源。此外,Lambda 对于处理时间按毫秒计费,而 ParallerCluster 计算节点在队列中没有任务时将容量减少至零,从而节省计算费用。
通过优化资源和基础设施来实现可持续性。ParallelCluster Slurm 调度程序可根据特定工作负载的需求智能地安排任务。为具有成本效益的 CPU 节点有效分配视频提取和转码任务,而 GPU 实例集则只用于计算密集型提质。这最大限度地减少了资源的过度配置,加快了产出时间,降低了能源需求。
免责声明
找到今天要查找的内容了吗?
请提供您的意见,以便我们改进网页内容的质量