亚马逊AWS官方博客
构建基于 Amazon Aurora 和 Amazon Bedrock 知识库的生成式 AI 应用程序
本文探讨如何使用 Amazon Aurora 构建使用 RAG 的生成式 AI 应用程序。我们将逐步介绍如何设置 Aurora 集群为 Amazon Bedrock 知识库,还将演示如何通过简单的 SQL 命令从 Amazon Bedrock 生成嵌入,使用 Amazon Aurora Machine Learning 扩展。
基于 IAM 的 EKS 权限管理详解(上)
结合 aws-auth ConfigMap 和 Cluster Access Management 两种方式阐述了基于 IAM 的 Amazon EKS 集群访问权限管理。
利用 Amazon ECS 进行分布式机器学习
在 Amazon ECS 服务上运行分布式机器学习工作负载可让 ML 团队更加专注于创建、训练和部署模型,而不是花时间去管理容器编排引擎。凭借着简单的架构、控制节点的无感升级以及集成了原生的 AWS IAM 认证服务,Amazon ECS 为运行 ML 项目提供了一个绝佳的环境。
联想车计算携手亚马逊云科技进行软件定义汽车新实践——基于 SOAFEE 架构和 SOCA 构建智驾超算平台
本文介绍联想与亚马逊云科技以 SOAFEE(Scalable Open Architecture For Embedded Edge)架构为基础,聚焦智能驾驶数据闭环的模型开发、仿真及验证领域,共同探索构建云边一体的混合云智能驾驶超算平台。
基于 Lambda 实现 Claude3 的流式响应
本文从端到端的视角,介绍了 Claude3 的流式推理,以及服务端流式响应的技术选型。通过比较分析,建议基于 Http-SSE 这种轻量级方式,来实现流式响应。
AWS Graviton3 加速 Spark 作业执行:Benchmark
本文将比较 5 种相同大小的 EC2 实例在 Spark 集群执行 TPC-DS Benchmark 时的性能和成本,并提供 Benchmark 环境搭建和执行的操作步骤。
使用 Amazon Athena 查询分析 Apache Paimon 数据
本文探索了使用 Amazon Athena 来对 Apache Paimon 表中的数据进行查询分析,包括使用 Athena for Apache Spark 以及开发 Athena Paimon Connector,使用 Athena Federated Query 这两种方式来连接和查询 Paimon 表。
基于 Amazon Bedrock 托管 Claude3 实现 RAG 增强文本检索的 Text to SQL 方案
基于 Amazon Bedrock 托管 Claude3 实现 RAG 增强文本检索的 Text to SQL 方案。其中 RAG 通过 Amazon Titan 实现 Embedding,通过向量检索工具进行向量文件保存和向量检索。最后得到有知识库背景的 prompt,连同上下文一起发送给大模型,得到更精准的输出。
高频交易底层优化方案
本文会提供在亚马逊云科技上构建 Cefi 高频交易系统的一些优化思路与硬件选择参考,也欢迎各位联系我们一起讨论更好的方案。
Amazon SageMaker 上的 Baichuan2 模型微调及部署(二)部署部分
本文主要介绍 Amazon SageMaker 上的 Baichuan2 模型部署方法。