亚马逊AWS官方博客

Category: News

S3 复制更新:复制 SLA、指标和事件

S3 的复制功能已得到充分利用:自 2015 年推出以来,我们的客户已复制了数万亿个对象和数艾字节的数据! 今天,我很高兴地告诉您,通过添加“复制时间控制”,我们使其功能更加强大。此功能建立在现有规则驱动复制的基础上,并为您提供基于标签或前缀的精细化控制,从而使您可以对指定的数据集使用复制时间控制。

新增功能 – 使用 Amazon EMR 和 Apache Hudi 插入、更新、删除 S3 上的数据

从今天开始,EMR 版本 5.28.0 包含 Apache Hudi(孵化),因此,您不再需要构建自定义解决方案来执行记录级插入、更新和删除操作。Hudi 开发于 2016 年开始于 Uber,用于解决提取和 ETL 管道间的效率低下。 近几个月来,EMR 团队与 Apache Hudi 社区密切合作,贡献了很多修补程序,包括将 Hudi 更新为 Spark 2.4.4 (HUDI-12)、支持 Spark Avro (HUDI-91)、增加对 AWS Glue Data Catalog (HUDI-306) 的支持以及多个漏洞修复。

AWS Data Exchange — 查找、订阅和使用数据产品

现在,我们又前进了一步,推出 AWS Data Exchange。AWS Marketplace 新增的这项服务包含来自 80 多个数据提供商的一千多种可许可数据产品。其中包括各类免费和付费产品,如金融服务、医疗保健/生命科学、地理空间、天气和绘图等类别的产品。