亚马逊AWS官方博客
使用 SageMaker AI 运行 GGUF 格式的模型推理实践
本文详细介绍了如何在 Amazon SageMaker AI 中部署 GGUF 格式的 LLM 模型。通过使用自带容器(BYOC)方法,文章展示了从创建 SageMaker Notebook 实例、构建必要文件、创建自定义 Docker 镜像,到在 SageMaker 中部署模型并进行推理测试的完整流程。
使用亚马逊云科技自研芯片 Inferentia2 部署 DeepSeek R1 Distillation 模型(一)
AWS Inferentia2 是亚马逊云科技自主研发的云端机器学习推理芯片,为深度学习推理工作负载提供高性能和高效率的计算能力,帮助客户在云端高效地部署和运行机器学习模型。
AWS 一周综述:AWS Step Functions、AWS CloudFormation、Amazon Q 开发者版等(2024 年 2 月 10 日)
到目前为止,我们已稳稳步入 2025 年,但仍有许多人还在努力跟进去年 re:Invent 大会上发布的那 […]
Amazon CloudFront 部署小指南(十二):Amazon CloudFront Anycast
近期推出的 CloudFront Anycast 静态IP,通过BGP技术提供固定IP地址,实现流量路由至最佳服务器。相比传统动态IP,这项功能在 零费率合作 和 企业防火墙白名单 场景中优势显著,简化ISP合作并提升安全性。部署需申请配额、创建IP列表并关联分配。
Amazon CloudFront 部署小指南(十一)- 实现指定请求特征绕行缓存(Bypass Cache)
本文将提供两种思路,实现 CloudFront 绕行缓存(Bypass Cache)
基于 Amazon Athena Amazon S3 和 Fluentbit 实现 Amazon EKS kubernetes event 的 Log 方案
在 Amazon EKS (Elastic Kubernetes Service) 上运行的应用程序通常会生成大量日志数据,有效地收集和分析这些日志对于故障排查、安全监控和成本优化至关重要。本方案利用 Amazon Athena、Amazon S3 和 Fluent Bit 构建了一个高度可扩展、成本效益高的 Kubernetes 事件日志解决方案。
利用 Amazon Client VPN, Amazon Directory Service 和 Amazon Transit Gateway 打造安全稳定的全球办公解决方案
利用亚马逊云科技的 Amazon Client VPN,Amazon Directory Service 和 Amazon Transit Gateway 等服务,企业可以构建一个安全可靠的全球办公网络环境,为远程员工提供无缝访问体验。该综合解决方案保护关键数据,支持全球多地办公室互连,助力企业灵活实现全球化布局。
AWS CodeBuild for macOS 现已支持 Fastlane
我很高兴地宣布,您现在可以在 AWS CodeBuild for macOS 环境中使用 Fastlane。A […]
使用Amazon Nova Lite实现多快好省的智能视频审核
本文将分享我们在实际案例中利用亚马逊在re:Invent 2024刚刚推出新一代自研大模型Amazon Nova Lite构建视频分享平台的智能审核方案。我们分别从审核的准确性、处理速度、运营成本等维度深入探讨这个话题。
AWS 一周综述:DeepSeek-R1、S3 Metadata、Elastic Beanstalk 更新等(2024 年 2 月 3 日)
上周,我在曼谷参加了泰国 AWS Community Day 活动,并度过了一段美妙的时光。此次活动恰逢其时, […]