发布于: Apr 28, 2021
Amazon Redshift 本地 JSON 和半结构化数据支持现已正式推出。它基于新的数据类型“SUPER”,这种数据类型允许您在 Amazon Redshift 数据仓库中分析和存储半结构化数据。Amazon Redshift 还包括对 PartiQL 的支持,以便以 SDL 兼容的方式访问关系、半结构化和嵌套数据。通过在 Amazon Redshift 中使用 SUPER 数据类型和 PartiQL,您可以执行高级分析,将经典结构化 SQL 数据(例如字符串、数字和时间戳)与具有卓越性能且灵活易用的半结构化 SUPER 数据(如 JSON)相结合。
SUPER 数据类型本质上是无架构的,它允许存储由 Redshift 标量值、嵌套数组或其他嵌套结构组成的嵌套值。Amazon Redshift 支持将 JSON 数据解析为 SUPER 类型,与将类似数据插入经典标量列相比,JSON/SUPER 数据插入速度提高了 5 倍。PartiQL 是 SQL 的扩展,已在多项 AWS 服务中被采用。PartiQL 允许通过高效的对象和数组导航来访问无架构的嵌套式 SUPER 数据,并且可以使用连接和聚合等经典分析操作灵活地组合查询。这使用户能够实现可发现结构化和半结构化数据组合的新的高级分析。数据工程师还可以直接在其 Redshift 集群中对插入的半结构化数据进行简化的低延迟 ELT(提取、加载、转换)处理,而无需与外部服务集成。促进 ELT 的 PartiQL 功能包括无架构语义、动态输入和类型自省功能,以及它的导航和非嵌套功能。现在,这些功能可以让分析和查询无架构数据变得更加轻松,用户无需在查询数据时预先发现所分析的每个源的数据类型,也无需处理不断演变的架构,或向不同类型的账户写入复杂的 SQL。通过创建物化视图,用户还可以轻松地分解半结构化数据,并且可以数量级地加快分析查询的速度,同时保持物化视图的自动和增量式维护。
Amazon Redshift 本地 JSON 和半结构化数据支持现已在所有商业区域推出
阅读文档,详细了解 Amazon Redshift 中的本地 JSON 和半结构化数据支持。