跳至主要内容

AWS 解决方案库

AWS 图像转文本和图像转语音指南

概览

本指南展示如何使用 AWS 机器学习和生成式人工智能服务将图像转换为文本和语音。将图像转换为文本是在 Amazon Kendra 的帮助下完成的,该搜索引擎可用于为图像存储库编制索引和搜索数据。接下来,生成式人工智能用于为图像制作说明文字,识别对象和特征,生成人类可读的文本描述,通常是基于提取的视觉特征的说明。本指南还介绍了如何将图像转换为语音,并且可以扩展到通过支持语音的设备(例如 Amazon Alexa)提供内容。这涉及到 Describe for Me Web 应用程序,该应用程序可生成图像说明,并以清晰、听起来像人类的声音(包括各种语言和方言)读回图像。

工作原理

工作原理

这些技术细节以架构图为特色,以说明如何有效使用该解决方案。架构图显示了关键组件及其相互作用,逐步概述了架构的结构和功能。
Architecture diagram illustrating an AWS workflow for image-to-text processing using Amazon S3, AWS Lambda, Amazon SageMaker, Amazon Textract, and Amazon Kendra.

工作原理

这些技术细节以架构图为特色,以说明如何有效使用该解决方案。架构图显示了关键组件及其相互作用,逐步概述了架构的结构和功能。
Architecture diagram illustrating the AWS Image to Speech workflow using AWS services such as Amplify, Cognito, S3, API Gateway, Lambda, Textract, Rekognition, SageMaker, Translate, and Polly within an AWS Step Functions workflow. The process begins with users uploading images, which are processed for extraction, recognition, translation, and then converted to audio using AWS Polly, with the resulting audio stored back in S3.

Well-Architected 支柱

上面的架构图是按照 Well-Architected 最佳实践创建的解决方案示例。要做到完全的良好架构,您应该遵循尽可能多的 Well-Architected 最佳实践。

    本指南使用 LambdaStep Functions 等 AWS 服务来自动执行任务,减少人工工作和错误,并使用 Amazon S3 提供可靠的数据存储。这些服务可以轻松适应不断变化的工作负载,并支持高效、一致的运营。此外,您可以使用亚马逊 CloudWatch 来监控运营并获得见解。

    阅读卓越运营白皮书

    本指南使用 LambdaStep Functions 来自动执行与安全相关的任务,从而降低安全流程中出现人为错误的风险。此外,API Gateway 强制执行 API 终端节点的安全管理,A mazon Cognito 增强用户身份验证和授权流程,AWS 身份和访问管理 (IAM) 控制 AWS 资源的访问权限。最后,CloudWatch 有助于实时检测安全事件或异常活动,从而推动快速响应事件和缓解威胁。

    阅读安全白皮书

    本指南通过 LambdaStep Functions 使用自动化来降低出现可能影响可靠性的人为错误的风险。此外,Amazon S3 提供数据复制和冗余功能以提高数据可靠性,而 API Gateway 则允许用户一致、安全地访问 API,以确保工作负载的可靠性。CloudWatch 监控运营,帮助检测和解决问题。这种主动方法通过最大限度地减少停机时间和中断来增强工作负载的可靠性。

    阅读可靠性白皮书

    本指南使用 LambdaStep Functions 实现流程自动化和简化工作流程,从而减少延迟和资源效率低下的情况。此外,SageMakerAmazon Polly 实现了实时内容生成,支持更快、更高效的工作负载,而 API Gateway 则优化了 API 管理,实现低延迟且一致的访问来提高性能效率。

    阅读性能效率白皮书

    本指南通过使用 LambdaStep Functions 来促进资源的高效利用,降低持续手动干预的需求,最大限度地减少人为错误和资源浪费,从而最大限度地减少运营开支。此外,Amazon Polly 还降低了对昂贵的手动内容创建的需求,API Gateway 优化了 API 管理,降低了计算相关成本,而 Amazon Kendra 提高了搜索效率,减少了在信息检索方面花费的时间和资源。最后,Amazon S3 提供可扩展且经济实惠的存储解决方案,使您可以高效地存储和访问数据,而不会产生不必要的开支。

    阅读成本优化白皮书

    本指南使用 LambdaAPI Gateway 等无服务器服务来提高能效、资源使用效率,并将可再生能源纳入使用范围。这些做法有助于实现可持续发展目标,帮助您减少碳足迹。

    阅读可持续发展白皮书

免责声明

示例代码;软件库;命令行工具;概念验证;模板;或其他相关技术(包括由我方人员提供的任何前述项)作为 AWS 内容按照《AWS 客户协议》或您与 AWS 之间的相关书面协议(以适用者为准)向您提供。您不应将这些 AWS 内容用在您的生产账户中,或用于生产或其他关键数据。您负责根据特定质量控制规程和标准测试、保护和优化 AWS 内容,例如示例代码,以使其适合生产级应用。部署 AWS 内容可能会因创建或使用 AWS 可收费资源(例如,运行 Amazon EC2 实例或使用 Amazon S3 存储)而产生 AWS 费用。

找到今天要查找的内容了吗?

请提供您的意见,以便我们改进网页内容的质量