亚马逊AWS官方博客

亚马逊云科技助力光伏企业生成式 BI 落地的实践探索

我们为一家光伏企业开发了基于生成式 AI 技术的商业智能工具,该工具极大提高了数据使用效率。传统 BI 工具难以满足企业大量即时查询和分析的需求,直接将数据库表 schema 作为提示词给大模型也效果不理想。我们采取了数据治理、使用具备物化视图特性的数仓产品、优化提示词工程、跨源数据使用 Pandas 聚合等措施。证实了良好的数据架构、优秀的提示词工程和高性能大模型对实现生成式 BI 的重要性。

基于 Claude 3 和 WhisperX 构建 ASR 方案(二)

在《基于 Claude 3 和 WhisperX 实现 ASR 方案(一)》中我们介绍了 WhisperX 模型的实现原理,以及如何在 AWS 上快速部署和使用 WhisperX 模型,实现语音转文字,视频字幕生成与对齐,识别不同的说话人等功能。通过 StreamlitUI 的方式,我们可以快速对 YouTube 视频、本地音频文件实现 ASR,方便我们做技术调研和 Demo 演示。

基于 Claude 3 和 WhisperX 构建 ASR 方案(一)

本文将深入探讨 WhisperX 的一个关键特性——说话人分离,剖析其实现原理和应用场景,并指导您如何在 AWS 上部署和使用该模型。Whisper 是一种先进的深度学习语音识别技术,能将语音精确转换为文字。其核心优势在于高效的神经网络结构和创新的训练方法,使其能应对各种复杂场景,如嘈杂环境、多样口音和不同语速。