亚马逊AWS官方博客

AWS Team

Author: AWS Team

借助 Cloud Foundations 规划设计云上多区域网络轴辐拓扑结构一键部署东西南北流量分别或合并检查丨Use Cloud Foundations to plan and design multi-regional hub-spoke network topology on the cloud and one-click deploy east-west south-north traffic inspection separated or combined

Recently, we have optimized our products, increased customization flexibility, and further reduced the major difficulties of the network building to help you efficiently create a secure, stable and scalable cloud network environment.

大语言模型工程化:挑战与解决方案

本文通过一个企业翻译应用案例,全面阐述了大语言模型应用从构思到上线的完整过程。文章讨论了业务场景发现与目标设定的重要性,分析了翻译应用面临的主要挑战,如专有名词翻译、长文本处理、翻译风格、准确度提升等。针对这些挑战,文章提出了使用定制模型、自省机制、专有词表、长文本拆解等解决方案。此外,还探讨了安全合规、部署策略、模型评估、用户反馈等重要考虑因素。最后,文章勾勒出一个通用的大语言模型应用架构,为企业构建和部署大语言模型应用提供了全面的参考框架。

利用大模型 embedding 结合 Aurora PostgreSQL 实现医疗术语检索增强生成的解决方案

在这篇博客中,我们将讨论使用双路召回的方式来优化医疗文献检索。其一是利用大模型对所有医疗文献的摘要进行 embedding,输出的向量数据存储到向量数据库;用户检索时,把用户输入的医疗术语进行 embedding 向量化,在向量数据库中进行相似性检索,找到最相似的文档。其二是通过对文献的摘要提取关键字,存入 Aurora PostgreSQL 中并创建倒排索引,实现对用户输入进行全文检索。两种方法结合,提高文档召回的精确度,缩小上图中的 Medical data 的范围和尺寸,达到减少幻觉并降低 token 数的诉求。