跳至主要内容

什么是零 ETL?

零 ETL 是一组集成,可最大限度地减少构建 ETL 数据管道的需求。提取、转换、加载(ETL)是合并、清理和标准化来自不同来源的数据,以便为分析、人工智能(AI)机器学习(ML)工作负载做好准备的过程。开发、维护和扩展传统的 ETL 流程既耗时又复杂。而零 ETL 集成便于点对点的数据移动,无需创建 ETL 数据管道。零 ETL 还可以跨数据孤岛进行查询,无需移动数据。 

了解 ETL »

零 ETL 集成可以解决哪些 ETL 挑战?

零 ETL 集成解决了传统 ETL 流程中许多现有的数据移动挑战。

系统复杂性增加

ETL 数据管道为您的数据集成工作增加了额外的复杂性。映射数据以匹配所需的目标架构涉及复杂的数据映射规则,并且需要处理数据不一致和冲突。您必须实施有效的错误处理、日志记录和通知机制才能诊断问题。数据安全要求进一步增加了对系统的限制。

额外费用

ETL 管道一开始就很昂贵,但随着数据量的增长,成本可能会螺旋式上升。对于大量数据,系统之间的重复数据存储可能负担不起。此外,扩展 ETL 流程通常需要昂贵的基础设施升级、查询性能优化和并行处理技术。如果需求发生变化,数据工程必须在更新过程中不断监控和测试管道,这会增加维护成本。

分析、人工智能和机器学习的时间延迟

ETL 通常要求数据工程师创建自定义代码,DevOps 工程师部署和管理扩展工作负载所需的基础设施。如果数据来源发生变化,数据工程师必须手动修改其代码并重新部署。该过程可能需要数周时间,从而导致分析、人工智能和机器学习工作负载的运行延迟。此外,构建和部署 ETL 数据管道所需的时间使得这些数据不适合近乎实时的应用场景,例如投放在线广告、检测欺诈性交易或实时供应链分析。在这些情况下,改善客户体验、抓住新商机或降低业务风险的机会就会丧失。

零 ETL 有哪些优势?

零 ETL 为组织的数据策略提供了多种好处。

提高敏捷性

Zero-ETL 简化了数据架构并减少了数据工程工作量。该功能允许包含新的数据来源,而无需重新处理大量数据。这种灵活性增强了敏捷性,支持数据驱动的决策和快速创新。

成本效益

零 ETL 利用云原生且可扩展的数据集成技术,使企业能够根据实际使用情况和数据处理需求优化成本。组织可以降低基础设施成本,减少开发工作量和维护开支。

缩短获得见解的时间

传统的 ETL 流程通常涉及定期的批量更新,从而导致数据可用性延迟。另一方面,零 ETL 提供实时或近乎实时的数据访问,确保分析、人工智能/机器学习和报告的最新数据。您可以更准确、更及时地了解实时控制面板、优化的游戏体验、数据质量监控和客户行为分析等应用场景。组织更有信心做出数据驱动的预测,改善客户体验,并在整个企业中推广数据驱动的洞察。

零 ETL 有哪些不同的应用场景?

零 ETL 有三个主要应用场景。

快速数据摄取

企业需要快速摄取并分析不同类型的数据,以便进行实时决策。零 ETL 提供了一种灵活的方法,可以快速将数据直接摄取到数据仓库和数据湖仓中。这消除了对传统 ETL 管道的需求,使组织能够轻松适应不断变化的业务需求。

流式摄取

数据流式传输和消息列队平台流式传输来自多个来源的实时数据。通过与数据仓库的零 ETL 集成,您可以从多个此类流中摄取数据,并几乎立即呈现以供分析。无需分阶段流式传输数据,因为这些平台还可以在数据移动时提供丰富的转换和分析。

即时复制

传统上,将数据从运营和事务数据库移动到中央数据仓库和数据湖仓总是需要复杂的 ETL 解决方案。如今,零 ETL 可以充当数据复制工具,即时将数据从运营数据库、事务数据库和应用程序复制到数据仓库和数据湖仓。复制机制使用变更数据捕获(CDC)技术,可以内置到数据仓库和数据湖仓中。用户看不到重复数据,应用程序将数据存储在事务数据库中,分析师可以从仓库中无缝查询数据。

AWS 如何支持您的零 ETL 工作?

AWS 投资于零 ETL 的未来。以下是为零 ETL 提供内置支持的服务示例。

亚马逊SageMaker Lakehouse和Amazon Redshift支持应用程序的零ETL集成,可自动从应用程序提取数据并将其加载到亚马逊SageMaker Lakehouse和亚马逊Redshift中。

亚马逊 DynamoDB Zero-ETL 与 Amazon SageMaker Lakhouse 的集成可自动将数据从亚马逊 DynamoDB 提取和加载到基于亚马逊 S3 的交易数据湖亚马逊 SageMaker Lakehouse。

亚马逊 OpenSearch Service Zero-ETL 与 Amazon CloudWatch Logs 的零ETL集成使您可以近乎实时地直接查询和可视化日志数据,集中管理日志,无需复杂的管道或预处理。

亚马逊 OpenSearch Service Zero-ETL 与 Amazon Security Lake 的集成可以直接搜索和分析安全数据,从而消除数据集成挑战,同时通过按需数据加速和丰富的分析功能降低复杂性、运营开销和成本。

亚马逊 Aurora Zero-ETL 与 Amazon Redshift 的集成可实现近乎实时的分析和机器学习 (ML)。该服务使用 Amazon Redshift 处理来自 Aurora 的大量 PB 级事务数据的分析工作负载。这是一种完全托管的解决方案,用于在将事务数据写入 Aurora 数据库集群后在 Amazon Redshift 中提供。

Amazon RDS for MySQL 与 Amazon Redshift 的零ETL集成有助于获得对许多应用程序的全面见解,打破组织中的数据孤岛,从而更轻松地在亚马逊Redshift中分析来自一个或多个Amazon RDS for MySQL实例的数据。

亚马逊 DynamoDB Zero-ETL 与亚马逊 OpenSearch Service 的集成为客户提供了高级搜索功能,例如对他们的亚马逊 DynamoDB 数据进行全文和矢量搜索。

亚马逊文档数据库零ETL与亚马逊OpenSearch服务的集成为客户提供了高级搜索功能,例如模糊搜索、交叉馆藏搜索和多语言搜索,使用OpenSearch API对其亚马逊DocumentDB文档进行模糊搜索、交叉馆藏搜索和多语言搜索。

亚马逊 OpenSearch 服务与 Amazon S3 的零ETL集成,这是客户在亚马逊S3数据湖中查询操作日志的一种新的有效方式,无需在工具之间切换来分析数据。

亚马逊 Aurora PostgreSQL 与 Amazon Redshift 的零 ETL 集成支持使用亚马逊 Redshift 分析来自 Aurora 的数千兆字节的交易数据,实现近乎实时的分析和机器学习 (ML)。

亚马逊DynamoDB与亚马逊Redshift的零ETL集成使客户能够在亚马逊Redshif t中对其DynamoDB数据进行高性能分析,而不会影响在DynamoDB上运行的生产工作负载。 

立即创建免费账户,开始在 AWS 上使用零 ETL!