亚马逊AWS官方博客
AWS 成本管理与优化之四:成本的可观察性
在本系列成本管理和优化的文章中,我们以 TAM 的视角,详细介绍 TAM 如何协助客户在 AWS 上实现高效的成本管理和优化。
使用 DolphinScheduler 进行 EMR 任务调度
此篇文章将介绍 DolphinScheduler 安装部署,以及在 DolphinScheduler 中进行作业编排,以使用 python 脚本的方式执行 EMR 的任务调度,包括创建集群、集群状态检查、提交 EMR Step 作业、EMR Step 作业状态检查,所有作业完成后终止集群。
基于 Amazon SageMaker 优化 Alpaca-lora 模型
如果要采用 stanford_alpaca 对 70 亿参数的 LLAMA 进行微调,对于机器的配置要求较高,不利于在行业内大规模使用。为了解决这个痛点,开源项目 alpaca_lora(https://github.com/tloen/alpaca-lora)应运而生。
大规模 DynamoDB 表数据跨账号迁移指南
本文主要介绍在大规模 DynamoDB 表数据跨账号迁移场景下,如何通过全量+增量的方式进行数据迁移,以满足对于停机窗口要求较短的需求。
在 AWS Nitro Enclaves 中运行传统 Web 应用迁移实践
本文介绍利用 vsock proxy 方案,让原有的传统服务器应用,直接运行在 Enclaves 内。
通过 Amazon Rekognition Face Liveness,进行用户真人检测、防止欺诈攻击
本文介绍了 Amazon Rekognition 中的新功能 Face Liveness 如何进行用户真人检测并防止欺诈攻击。您可在美国东部(弗吉尼亚州北部)、美国西部(俄勒冈州)、欧洲(爱尔兰)、亚太地区(孟买)和亚太地区(东京)地区使用 Amazon Rekognition Face Liveness 功能。
SHAREit 大数据平台 DataCake 在 Spark on EKS 的实践
SHAREit 自研一站式、自助化大数据平台 DataCake,采用 Spark on EKS 调度 Spot 实例来进行数据 Batch 计算。我们通过自研的 Spark PVC Reuse 方案,最大限度地降低 Spot 回收的影响,任务平均执行时间下降 41%,整体成本降低了 39%。
联想 Filez 云和 AWS 云融合解决方案,为企业文档管理及协作降本增效
联想 Filez+Amazon S3 多云融合解决方案,为企业文档管理及协作降本增效
Web 端 S3 多个小文件下载优化
Web 端 S3 多个小文件下载优化
使用 Amazon EC2 Inf2 实例运行大语言模型 GPT-J-6B
在 2019 年的 AWS re:Invent 上,亚马逊云科技发布了 Inferentia 芯片和 Inf1 实例,Inferentia 是一种高性能机器学习推理芯片,由 AWS 定制设计:其目的是提供具有成本效益的大规模低延迟预测。时隔四年,2023 年 4 月亚马逊云科技发布了 Inferentia2 芯片和 Inf2 实例,旨在为大型模型推理提供技术保障。本文将介绍如果使用 Inf2 实例运行 GPT-J-6B 模型。