¿Qué es la modalidad sin ETL?

Crear una cuenta de AWS

Temas de la página

¿Qué es la modalidad sin ETL?
¿Qué desafíos de ETL resuelve la integración sin ETL?
¿Cuáles son las ventajas de la modalidad sin ETL?
¿Cuáles son los diferentes casos de uso de una modalidad sin ETL?
¿Cómo puede AWS respaldar sus iniciativas de modalidad sin ETL?

¿Qué es la modalidad sin ETL?

La modalidad sin ETL es un conjunto de integraciones que minimiza la necesidad de crear canalizaciones de datos ETL. La extracción, transformación y carga (ETL) es el proceso de combinar, limpiar y normalizar datos de distintas fuentes y prepararlos para las cargas de trabajo de análisis, inteligencia artificial (IA) y machine learning (ML). Los procesos ETL tradicionales consumen mucho tiempo y son complejos de desarrollar, mantener y escalar. En cambio, las integraciones sin ETL facilitan el movimiento de datos punto a punto sin necesidad de crear canalizaciones de datos ETL. La modalidad sin ETL también permite realizar consultas en silos de datos sin necesidad de mover los datos.

Más información sobre ETL »

¿Qué desafíos de ETL resuelve la integración sin ETL?

Las integraciones sin ETL resuelven muchos de los desafíos de movimiento de datos existentes en los procesos ETL tradicionales.

Mayor complejidad del sistema

Las canalizaciones de datos ETL añaden una capa adicional de complejidad a sus esfuerzos de integración de datos. El mapeo de datos para que coincidan con el esquema de destino deseado implica reglas de mapeo de datos complejas y requiere el manejo de inconsistencias y conflictos de datos. Debe implementar mecanismos eficaces de gestión de errores, registro y notificación para diagnosticar los problemas. Los requisitos de seguridad de los datos aumentan aún más las restricciones del sistema.

Costos adicionales

Las canalizaciones de ETL son caras al principio, pero los costos pueden aumentar a medida que aumenta el volumen de datos. Es posible que el almacenamiento de datos duplicado entre sistemas no sea asequible para grandes volúmenes de datos. Además, escalar los procesos de ETL a menudo requiere costosas actualizaciones de infraestructura, optimización del rendimiento de las consultas y técnicas de procesamiento en paralelo. Si los requisitos cambian, la ingeniería de datos debe monitorear y probar constantemente la canalización durante el proceso de actualización, lo que aumenta los costos de mantenimiento.

Retraso en el tiempo de análisis, IA y ML

Por lo general, ETL requiere que los ingenieros de datos creen código personalizado, así como que los ingenieros de DevOps implementen y administren la infraestructura necesaria para escalar la carga de trabajo. En caso de cambios en el origen de datos, los ingenieros de datos deben modificar manualmente su código y volver a implementarlo. El proceso puede llevar semanas y provocar retrasos en la ejecución de las cargas de trabajo de análisis, inteligencia artificial y machine learning. Además, el tiempo necesario para construir y desplegar canalizaciones de datos ETL hace que los datos no sean aptos para casos de uso casi en tiempo real, como la publicación de anuncios en línea, la detección de transacciones fraudulentas o el análisis de la cadena de suministro en tiempo real. En estos escenarios, se pierde la oportunidad de mejorar las experiencias de los clientes, abordar nuevas oportunidades comerciales o reducir los riesgos comerciales.

¿Cuáles son las ventajas de la modalidad sin ETL?

La modalidad sin ETL ofrece varios beneficios a la estrategia de datos de una organización.

Mayor agilidad

La modalidad sin ETL simplifica la arquitectura de datos y reduce los esfuerzos de ingeniería de datos. Permite incluir nuevos orígenes de datos sin necesidad de volver a procesar grandes cantidades de datos. Esta flexibilidad mejora la agilidad, apoya la toma de decisiones basada en datos y la innovación rápida.

Rentabilidad

La modalidad sin ETL utiliza tecnologías de integración de datos que son escalables y nativas en la nube, lo que permite a las empresas optimizar los costos en función del uso real y las necesidades de procesamiento de datos. Las organizaciones reducen los costos de infraestructura, los esfuerzos de desarrollo y los gastos generales de mantenimiento.

Mayor rapidez en la obtención de información

Los procesos ETL tradicionales suelen implicar actualizaciones periódicas por lotes, lo que provoca un retraso en la disponibilidad de los datos. La modalidad sin ETL, por otro lado, proporciona acceso a los datos en tiempo real o casi real, lo que garantiza datos más actualizados para el análisis, la inteligencia artificial y el aprendizaje automático y la elaboración de informes. Obtiene información más precisa y oportuna para casos de uso como paneles de control en tiempo real, experiencia de juego optimizada, monitoreo de la calidad de los datos y análisis del comportamiento de los clientes. Las organizaciones hacen predicciones basadas en datos con más confianza, mejoran la experiencia de los clientes y promueven los conocimientos basados en datos en toda la empresa.

¿Cuáles son los diferentes casos de uso de una modalidad sin ETL?

Hay tres casos de uso principales para una modalidad sin ETL.

Ingesta de datos rápida

Las empresas necesitan ingerir y analizar rápidamente diferentes tipos de datos para tomar decisiones en tiempo real. La modalidad sin ETL proporciona un enfoque flexible para ingerir datos rápidamente y directamente en almacenes de datos y almacenes de lago de datos. Esto elimina la necesidad de utilizar canales ETL tradicionales, lo que permite a las organizaciones adaptarse con facilidad a los cambiantes requisitos empresariales.

Ingesta de streaming

Las plataformas de streaming de datos y colas de mensajes transmiten datos en tiempo real desde varias fuentes. Una integración sin ETL con un almacén de datos le permite ingerir datos de varios de estos flujos y presentarlos para su análisis casi al instante. No es necesario organizar los datos de streaming, ya que estas plataformas también ofrecen transformaciones y análisis detallados mientras los datos están en movimiento.

Replicación instantánea

Tradicionalmente, mover datos de una base de datos operativa y transaccional a un almacén de datos y a un almacén de lago de datos central siempre requería una solución ETL compleja. En la actualidad, la modalidad sin ETL puede actuar como una herramienta de replicación de datos, duplicando instantáneamente los datos de la base de datos operativa, la base de datos transaccional y las aplicaciones en el almacén de datos y el almacén de lago de datos. El mecanismo de duplicación utiliza técnicas de captura de datos cambiados (CDC) y puede estar integrado en el almacén de datos y en el almacén de lagos de datos. La duplicación es invisible para los usuarios: las aplicaciones almacenan datos en la base de datos transaccional y los analistas consultan los datos del almacén sin problemas.

¿Cómo puede AWS respaldar sus iniciativas de modalidad sin ETL?

AWS invierte en un futuro de modalidades sin ETL. Estos son ejemplos de servicios que ofrecen soporte integrado para una modalidad sin ETL.

La edición compatible con My SQL de Amazon Aurora y Amazon RDS para MySQL ahora admite la integración sin ETL con Amazon SageMaker, lo que permite la disponibilidad de datos casi en tiempo real para las cargas de trabajo de análisis.

Almacén de lago de Amazon SageMaker y Amazon Redshift admiten integraciones sin ETL desde las aplicaciones, lo que automatiza la extracción y la carga de datos de las aplicaciones en Amazon SageMaker Lakehouse y Amazon Redshift.

La integración sin ETL de Amazon DynamoDB con Almacén de lago de Amazon SageMaker automatiza la extracción y la carga de datos de Amazon DynamoDB en Amazon SageMaker Lakehouse, un lago de datos transaccionales creado en Amazon S3.

La integración sin ETL de Amazon OpenSearch Service con los Registros de Amazon CloudWatch permite la consulta directa y la visualización de los datos de registro casi en tiempo real, centralizando la administración de registros sin necesidad de canalizaciones complejas ni procesamiento previo.

La integración sin ETL de Amazon OpenSearch Service con Amazon Security Lake permite la búsqueda y el análisis directos de los datos de seguridad, lo que elimina los desafíos de la integración de datos y reduce la complejidad, la sobrecarga operativa y los costos mediante la aceleración de datos bajo demanda y las amplias capacidades analíticas.

La integración sin ETL de Amazon Aurora con Amazon Redshift permite el análisis y machine learning (ML) casi en tiempo real. Utiliza Amazon Redshift para cargas de trabajo de análisis en petabytes de datos transaccionales de Aurora. Es una solución totalmente gestionada para hacer que los datos transaccionales estén disponibles en Amazon Redshift después de escribirlos en un clúster de base de datos Aurora.

La integración sin ETL de Amazon RDS para MySQL con Amazon Redshift ayuda a derivar información holística de muchas aplicaciones y a romper los silos de datos de su organización, lo que simplifica el análisis de datos de una o varias instancias de Amazon RDS para MySQL en Amazon Redshift.

La integración sin ETL de Amazon DynamoDB con Amazon OpenSearch Service proporciona a los clientes capacidades de búsqueda avanzadas, como la búsqueda vectorial y de texto completo, en sus datos de Amazon DynamoDB.

La integración sin ETL de Amazon DocumentDB con Amazon OpenSearch Service proporciona a los clientes capacidades de búsqueda avanzadas, como la búsqueda difusa, la búsqueda entre colecciones y la búsqueda multilingüe, en sus documentos de Amazon DocumentDB mediante la API OpenSearch.

La integración sin ETL de Amazon OpenSearch Service con Amazon S3, una nueva forma eficaz para que los clientes consulten los registros operativos en los lagos de datos de Amazon S3, lo que elimina la necesidad de cambiar de una herramienta a otra para analizar los datos.

La integración sin ETL de Amazon Aurora PostgreSQL con Amazon Redshift permite el análisis y el machine learning (ML) casi en tiempo real con Amazon Redshift para analizar petabytes de datos transaccionales de Aurora.

La integración sin ETL de Amazon DynamoDB con Amazon Redshift permite a los clientes ejecutar análisis de alto rendimiento en sus datos de DynamoDB en Amazon Redshift sin afectar a las cargas de trabajo de producción que se ejecutan en DynamoDB.

Para comenzar a utilizar los procesos de zero ETL en AWS, ¡cree una cuenta gratuita hoy mismo!

Siguientes pasos en AWS

Descubra otros recursos relacionados con el producto

Consulte las ofertas gratuitas de servicios de análisis en la nube

Regístrese para obtener una cuenta gratuita

Obtenga acceso instantáneo al nivel gratuito de AWS.

Regístrese

Comience a crear en la consola

Comience a crear en la Consola de administración de AWS.

Inicie sesión

Browse all cloud computing concepts

Browse all cloud computing concepts content here:

Cargando

Did you find what you were looking for today?

Let us know so we can improve the quality of the content on our pages

¿Qué es la modalidad sin ETL?

Temas de la página

¿Qué es la modalidad sin ETL?

¿Qué desafíos de ETL resuelve la integración sin ETL?

Mayor complejidad del sistema

Costos adicionales

Retraso en el tiempo de análisis, IA y ML

¿Cuáles son las ventajas de la modalidad sin ETL?

Mayor agilidad

Rentabilidad

Mayor rapidez en la obtención de información

¿Cuáles son los diferentes casos de uso de una modalidad sin ETL?

¿Cómo puede AWS respaldar sus iniciativas de modalidad sin ETL?

Siguientes pasos en AWS

Descubra otros recursos relacionados con el producto

Regístrese para obtener una cuenta gratuita

Comience a crear en la consola

Browse all cloud computing concepts

Did you find what you were looking for today?

Aprender

Recursos

Desarrolladores

Ayuda