亚马逊AWS官方博客
五行俱下 – 如何在短时间里遍历 Amazon S3 亿级对象桶(原理篇)
本篇博客介绍了使用 Amazon S3 的 ListObjectsV2 API 实现快速遍历亿级对象存储桶的基本原理。
DolphinScheduler + EMR Serverless 的集成实践
本文通过对 EMR on EC2 与 EMRServerless 中 Spark 任务的提交、监控、下载日志过程进行抽象并封装成 Python 类库,极大地简化了使用 Spark 的门槛,以及从 EMR on EC2 切换至 EMRServerless 的改造成本。
通过 Amazon Aurora MySQL 数据库重新启动时间优化缩短停机时间
使用兼容 Amazon Aurora MySQL 的版本在亚马逊云科技云中运行您的关系数据库时,关键要求之一是 […]
利用 Mountpoint for S3 在 Kubernetes 上加速 LLM 的训练
本文展示了利用 Mountpoint for Amazon S3 CSI driver 将 S3 存储桶挂载在 Kubernetes 容器下,容器中的 LLM 训练脚本通过读取 Mountpoint for S3 挂载目录的方式直接访问S3存储桶上的数据进行训练。
AWS Lambda 中使用多线程解压 Amazon S3 大文件
在传统的 Lambda 自动解压方案中,解压后的上万个文件重新上传回 S3,使用单个线程需要消耗非常长的时间,甚至超过 Lambda 所能运行的最长时间(15 分钟)。您可以在 Lambda 使用多线程的运行,提高大文件解压上传的速度,最大可提高 30 倍。
StarRocks 3.0 存算分离版基于亚马逊云科技的最佳实践
StarRocks 致力于构建新一代极速全场景 MPP (Massively Parallel Processing)数据库,致力于帮助企业构建极速统一的湖仓分析新范式。从初创公司到企业,组织都在使用 StarRocks on AWS 解决方案进行数据分析和治理。 StarRocks on AWS 让我们的客户可以在全球各地快速可靠地构建自己的数据分析中心。现在,为了让更多用户以更低廉的成本进行数据分析和治理,我们推出了存算分离版本。让我们的用户可以提高资源利用率的同时优化成本。
依托亚马逊云科技构建韧性应用
现代业务系统受到越来越多的韧性相关的挑战,特别是客户要求他们的业务系统 7×24 不间断的运行。因此,韧性对于云的基础设施和应用系统有着至关重要的作用。 亚马逊云科技把韧性视为一项最基本的工作,为了让我们的业务系统能持续优雅地提供服务,从各种故障和灾难中迅速恢复,亚马逊云科技不仅提供了全球高可用的基础设施,也提供了构建韧性系统的最佳实践和方法。
通过 Amazon Clean Rooms 助力广告行业实现隐私保护的数据协作
本文介绍了 Clean Rooms 在面临广告行业隐私数据保护需求挑战时提供的解决方案,以及 Clean Rooms 中的分析规则、数据连接和最佳实践等。可以看到,Clean Rooms 为广告行业实现隐私保护的数据协作提供了重要支持,而随着服务的不断完善和新功能的增添,相信它将为企业开启更多高效、安全的协作新模式,实现隐私保护和商业价值的双赢。
AWS Media Services 和 SyncWords 让多语种自动字幕和音频配音在直播活动中成为可能
本文由 SyncWords 商业发展与战略部副总裁 Giovanni Galvez 合著。 引言 对业界而言, […]
尝试使用 Amazon OpenSearch Service 向量引擎进行语义搜索
Amazon OpenSearch Service 自 2020 年推出 kNN 插件以来,一直支持词法和向量 […]