发布于: May 10, 2018

Amazon Kinesis Data Firehose 增加了对 Apache Parquet 和 Apache ORC 格式的支持,因此您可以将实时数据以流式处理的方式传输到 Amazon S3 中,享受成本高效的存储和分析服务。

Apache Parquet 和 Apache ORC 属于列数据格式,允许您以更高效、更经济的方式存储和查询数据。您现在可以配置自己的 Kinesis Data Firehose 传输流,以自动将数据转换为 Parquet 或 ORC 格式后再传输到您的 S3 存储桶。这无需任何编码,您可以使用 Amazon AthenaAmazon Redshift Spectrum 远远更快地查询 S3 数据,从而帮助您节约存储和查询成本。 基于使用量的计费模式适用于 Kinesis Data Firehose 中的数据格式转换。有关更多信息,请参阅定价页面

Amazon Kinesis Data Firehose 是将流数据加载到 AWS 的最简单方式。如要开始使用 Kinesis Data Firehose,请访问控制台以及开发人员指南

如需 Kinesis Data Firehose 可用区的列表,请参阅 AWS 区域表