亚马逊AWS官方博客
Tag: Amazon S3
使用 Amazon Glue DataBrew 对数据进行预处理
使用 Amazon Glue DataBrew 对数据进行预处理
Read MoreAmazon GameTech 架构最佳实践系列 —— MOBA/FPS数据分析篇
AmazonGameTech架构最佳实践系列,本篇介绍MOBA和FPS类游戏数据收集与分析最佳实践
Read More基于云原生构建的 HPC 平台演示
Blog结合 AWS Serverless 及云原生的HPC服务,演示了相对完整的HPC业务场景,包括前端交互、任务自动化编排及调度、HPC 计算与任务管理,以及CI/CD与基础设施代码化构建业务所需环境。
Read More使用 Amazon Personalize 的用户细分功能来提高广告投放效果
使用 Amazon 托管的机器学习产品 Personalize 新推出的 User Segmentation 功能,可以帮助没有机器学习背景的人轻松地完成客户分群,做到精准化运营,提高广告投放的转化率,商品推荐的召回率。
Read MoreSpark SQL 任务迁移到Amazon EMR 及性能调优
介绍了如何把IDC里的ETL任务快速迁移上云,并在保证低成本的同时,提升了性能表现,降低代码改动量和运维成本。
Read More使用 Amazon Personalize 快速搭建推荐服务
在本文中,将向您展示如何使用Amazon Personalize构建自动训练和推理的推荐服务。文中采用MovieLens电影评分数据作为样本数据并将数据存储在S3中,文中将利用lambda函数触发数据更新,模型训练,模型更新和模型批量推理。
Read MorePB 级 HDFS 格式数据迁移到 Amazon S3 数据湖最佳实践
随着数据源和数据量的增加,存储新连接数据的需求也在增长。企业客户使用 Hadoop 分布式文件系统 (HDFS) 作为本地 Hadoop 应用程序的数据湖存储库。客户正在将他们的PB级数据迁移到 AWS,以获得更安全、可扩展、敏捷且经济高效的解决方案。
Read More基于无服务器架构和事件驱动的 Data Lake 数据移动
本文探讨一种基于亚马逊云科技无服务器架构和事件驱动的数据移动方案(Replication Kit, Replikit),以满足数据在数据湖上特定场景下的数据发布需求。Replikit可以帮助实现:数据文件的多路定向输出、可跨AWS Partition分区的数据移动、数据移动同时的数据格式转换、多种网络环境以及长期或短期凭证授权下的数据移动。
Read More基于 AWS ECR 或 S3 搭建 Helm Chart 仓库
随着容器化技术的普及,越来越多的公司选择使用Kubernetes管理云平台中多主机上的容器化应用。Helm是查找、分享和使用软件构建Kubernetes的最优方式之一。如何高可用、可伸缩的管理Helm Chart成为研发团队必须要考虑的问题之一。 在AWS上,我们可以使用S3或ECR快速搭建一个高可用的Helm Chart仓库。
Read More