亚马逊AWS官方博客
AWS 每周回顾:Mithra、Amazon Titan 图像生成器 v2、AWS GenAI Lofts 和更多服务(2024 年 8 月 12 日)
当人工智能和数据副总裁 Swami Sivasubramanian 博士 2005 年在 Amazon 实 […]
Aurora MySQL 2 升级之蓝绿部署切换后自动搭建 DMS 回滚复制的方案
很多客户为了 Aurora 升级方案更加完备,会增加回滚方案,即在蓝绿部署切换后,需要搭建 1 个从新主集群到旧蓝集群的数据复制链路,目的是把新主集群的数据变化准实时同步回旧的蓝环境。目前蓝绿部署功能,在切换后暂不支持自动搭建回滚复制,本文提供一种方案,自动捕捉蓝绿部署切换完成的事件,调用 Lambda 函数,利用 DMS CDC 复制任务,自动搭建回滚复制链路。
利用 FP8 量化加速 Llama-3-70B 推理
本文针对在 Amazon P5 (H100 GPU) 上部署 Llama-3-70b FP8 精度模型的两种方 […]
Amazon SageMaker HyperPod 存储设计与实践(二)
在 Amazon SageMaker HyperPod存储设计与实践(一)中我们实现了 SageMaker H […]
在 Amazon SageMaker 平台上使用 LlamaFactory 框架训练 Meta Llama3
背景 相较于直接使用 EC2,通过 Amazon SageMaker 进行模型训练具有训练环境统一,降低训练实 […]
使用 Amazon Q 加速软件开发生命周期
软件开发团队一直在寻求加速软件开发生命周期(SDLC)的方法,以更快地发布高质量软件。作为一款由生成式人工智能 […]
使用 Amazon Bedrock Cohere 多语言嵌入模型构建金融搜索应用程序
这篇文章展示了使用 Amazon Bedrock 上的 Cohere Embed 和 Rerank 模型,在不同语言的金融新闻中进行搜索和查询的应用程序。
为生成式 AI 工作负载设计弹性
理解并优先考虑弹性对于生成式 AI 工作负载来满足组织的可用性和业务连续性要求至关重要。这篇文章讨论了生成式 AI 工作负载的不同技术栈以及应该考虑的因素。
基于 AWS Step Functions 和 AWS Batch 服务构建宏基因分析工作负载
本文旨在介绍一个在 AWS 上构建宏基因分析工作负载的方案,该方案对常用的一些宏基因分析软件完成了容器化,并以批量计算服务 AWS Batch 为核心,构建容器化的宏基因分析集群和自动化工作流。本方案已经在多个客户的实际宏基因分析业务中得到应用,如土壤微生物/病毒宏基因分析,海洋微生物宏基因分析等。根据客户的实际业务场景,本方案也可以扩展到通用的基因分析场景。
Amazon Titan 图像生成器 v2 现已在 Amazon Bedrock 中推出
今天,我们宣布 Amazon Titan 图像生成器 v2 模型正式推出,该模型在 Amazon Bedroc […]