亚马逊AWS官方博客
Category: Compute
在 AWS Graviton 上运行大语言模型:CPU 推理性能实测与调优指南
本文基于 AWS Graviton 系列实例与 llama.cpp 工具链,实测了 Llama 3、DeepSeek 等模型的推理性能,并与 Intel/AMD 实例对比,揭示 CPU 在大模型推理中的潜力。
AWS 一周综述:Amazon Q CLI 代理、AWS Step Functions、AWS Lambda 等(2025 年 3 月 10 日)
随着北半球天气逐渐转好,人们有了更多学习和交流的机会。本周,我将前往旧金山,我们可以在 AWS GenAI L […]
AWS 一周综述:云俱乐部队长应用程序、Formula 1®、Amazon Nova 提示工程等(2025 年 2 月 24 日)
2 月 20 日举办的 2025 年 AWS 开发者日活动展示了如何将可靠的生成式人工智能集成到开发工作流程中 […]
监控 Amazon EC2 实例运行时长,及时释放临时资源
在日常资源管理时,我们经常会遇到临时业务需求、开发测试环境、业务峰值应对等场景,为了满足这些需求我们需要扩展 […]
VPC 端点的 AWS CloudTrail 网络活动事件现已正式推出
现在,我很高兴地宣布,AWS CloudTrail 中 Amazon Virtual Private Clou […]
使用亚马逊云科技自研芯片 Inferentia2 部署 DeepSeek R1 Distillation 模型(二)
亚马逊云科技已于 2025 年 1 月上线 DeepSeek 系列大模型,用户可以通过以下几种方式在亚马逊云科 […]
10p10u:亚马逊云科技革新网络架构,助力大规模 AI 训练
本文介绍了亚马逊云科技作为云计算领域的领导者,通过创新的 10p10u 网络架构,为满足万卡级别 Nvidia GPU 或亚马逊自研 Trainium2 加速器的超大规模算力需求挑战提供了网络解决方案。本文详细介绍这一突破性技术的背景、设计目标和核心创新。
使用亚马逊云科技自研芯片 Inferentia2 部署 DeepSeek R1 Distillation 模型(一)
AWS Inferentia2 是亚马逊云科技自主研发的云端机器学习推理芯片,为深度学习推理工作负载提供高性能和高效率的计算能力,帮助客户在云端高效地部署和运行机器学习模型。
AWS CodeBuild for macOS 现已支持 Fastlane
我很高兴地宣布,您现在可以在 AWS CodeBuild for macOS 环境中使用 Fastlane。A […]
AWS 一周综述:DeepSeek-R1、S3 Metadata、Elastic Beanstalk 更新等(2024 年 2 月 3 日)
上周,我在曼谷参加了泰国 AWS Community Day 活动,并度过了一段美妙的时光。此次活动恰逢其时, […]