亚马逊AWS官方博客
亚马逊云科技账户设置指南
本博客从安全性和稳定性的方面介绍亚马逊云科技账户基本的必要配置步骤。旨在保护客户的云账户,保证业务程序的稳定运行。
借助 Cloud Foundations 规划设计云上多区域网络轴辐拓扑结构一键部署东西南北流量分别或合并检查丨Use Cloud Foundations to plan and design multi-regional hub-spoke network topology on the cloud and one-click deploy east-west south-north traffic inspection separated or combined
Recently, we have optimized our products, increased customization flexibility, and further reduced the major difficulties of the network building to help you efficiently create a secure, stable and scalable cloud network environment.
Amazon API Gateway 跨域请求(CORS)配置
Amazon API Gateway 中 REST API 和 HTTP API 跨源资源共享的配置技巧
使用 Lambda 优化亚马逊云科技 Cloudfront 服务实时日志成本
对于大多数 Cloudfront 日志场景,Kinesis Firehose 提供了一种简单、可靠且经济高效的解决方案。而对于有特殊需求或对成本有更高要求的场景, 本文提出一种使用 Lambda 函数可以带来更大的优化空间。
ComfyUI 集成 Stable Diffusion 3 在亚马逊云科技的典型使用场景介绍
本文将 SD3 在 AWS 的主要使用方式做了总结,并针对性的提出其适用场景。
大语言模型工程化:挑战与解决方案
本文通过一个企业翻译应用案例,全面阐述了大语言模型应用从构思到上线的完整过程。文章讨论了业务场景发现与目标设定的重要性,分析了翻译应用面临的主要挑战,如专有名词翻译、长文本处理、翻译风格、准确度提升等。针对这些挑战,文章提出了使用定制模型、自省机制、专有词表、长文本拆解等解决方案。此外,还探讨了安全合规、部署策略、模型评估、用户反馈等重要考虑因素。最后,文章勾勒出一个通用的大语言模型应用架构,为企业构建和部署大语言模型应用提供了全面的参考框架。
利用大模型 embedding 结合 Aurora PostgreSQL 实现医疗术语检索增强生成的解决方案
在这篇博客中,我们将讨论使用双路召回的方式来优化医疗文献检索。其一是利用大模型对所有医疗文献的摘要进行 embedding,输出的向量数据存储到向量数据库;用户检索时,把用户输入的医疗术语进行 embedding 向量化,在向量数据库中进行相似性检索,找到最相似的文档。其二是通过对文献的摘要提取关键字,存入 Aurora PostgreSQL 中并创建倒排索引,实现对用户输入进行全文检索。两种方法结合,提高文档召回的精确度,缩小上图中的 Medical data 的范围和尺寸,达到减少幻觉并降低 token 数的诉求。
使用 Envoy Redis Proxy 在 Amazon ElastiCache 集群进行数据同步
背景 随着 IT 信息系统在各行各业的演进越来越快,用户对 IT 信息系统的依赖性越来越强,对 IT 信息系统 […]
条条大路通罗马 – Spring Data Redis 连接 Elasticache Redis 集群模式
1. 前言 Amazon ElastiCache 是一种 Web 服务,可让用户在云中轻松设置、管理和扩展分布 […]
AWS Graviton4 加速 Apache APISIX 消息处理
本文将比较 4 种相同大小的 EC2 实例在执行 APISIX Benchmark 时的性能和性价比,总结在 Graviton4 使用 APISIX 的优势,并提供 Benchmark 环境搭建和执行的操作步骤。