¿En qué consiste el enfoque de Lake House?

Integre sin problemas el lago de datos, el almacenamiento de datos y los almacenes de datos creados para fines específicos

El enfoque de Lake House: cómo funciona

El enfoque de Lake House parte del principio de que la adopción de un enfoque único para el análisis provoca eventualmente compromisos. No se trata simplemente de integrar un lago de datos con un almacenamiento de datos, sino de integrar un lago de datos, un almacenamiento de datos y almacenes creados para fines específicos, con lo que se consigue una gobernanza unificada y una fácil transferencia de datos. Con una arquitectura de Lake House en AWS, los clientes pueden almacenar datos en un lago de datos y utilizar un conjunto de servicios de datos creados para fines específicos en torno al lago, con lo que es posible tomar decisiones con rapidez y agilidad, a una escala y un precio/rendimiento inigualables en el mercado.

La arquitectura de lake house requiere que los clientes:

  • Creen rápidamente lagos de datos escalables
  • Utilicen una amplia y completa colección de servicios de datos creados para fines específicos
  • Garanticen la conformidad mediante un modo unificado de proteger, monitorear y administrar el acceso a sus datos
  • Aumenten la escala de sus sistemas a un bajo coste sin comprometer el rendimiento
Cómo funciona: el enfoque de Lake House

¿Por qué es necesario adoptar el enfoque de Lake House?

Los volúmenes de datos aumentan a un ritmo sin precedentes, de terabytes a petabytes y a veces a exabytes. Los enfoques tradicionales de análisis de datos en las instalaciones no pueden gestionar estos volúmenes de datos porque no son lo suficientemente escalables y resultan demasiado caros. Varias empresas se encuentran en el proceso de recopilar todos sus datos a partir de diversos silos para agruparlos en un solo lugar, que muchos denominan lago de datos, para realizar análisis y ML directamente sobre esos datos. En otras ocasiones, estas mismas empresas almacenan otros datos en almacenes de datos creados para fines específicos y así poder analizar y obtener rápidamente información a partir de datos estructurados y no estructurados. Este traslado de datos puede ser “desde el interior hacia el exterior”, “desde el exterior hacia el interior” o “alrededor del perímetro” porque los datos tienen gravedad.

  • Desde el interior hacia el exterior
  • Desde el exterior hacia el interior
  • Alrededor del perímetro
  • Gravedad de los datos
  • Desde el interior hacia el exterior
  • Traslado de datos desde el interior hacia el exterior

    Los clientes almacenan los datos en un lago de datos y luego trasladan una parte de esos datos a un almacén de datos creado para fines específicos en el que se realizan actividades adicionales de machine learning o análisis.

    Ejemplo: los datos de secuencias de clics de las aplicaciones web se pueden recopilar directamente en un lago de datos, y una parte de esos datos se puede trasladar a un almacenamiento de datos para la elaboración de informes diarios. Denominamos a este concepto como traslado de datos desde el interior hacia el exterior.

    Traslado de datos desde el interior hacia el exterior
  • Desde el exterior hacia el interior
  • Traslado de datos desde el exterior hacia el interior

    Los clientes almacenan los datos en almacenes de datos creados para fines específicos, como un almacenamiento de datos o una base de datos, y trasladan esos datos a un lago de datos para realizar análisis sobre ellos. 

    Ejemplo: copian en su lago de datos los resultados de las consultas sobre las ventas de productos en una región determinada a partir de un almacenamiento de datos para ejecutar algoritmos de recomendación de productos en un conjunto de datos más amplio mediante ML.

    Traslado de datos desde el exterior hacia el interior
  • Alrededor del perímetro
  • Traslado de datos alrededor del perímetro

    Integre sin problemas el lago de datos, el almacenamiento de datos y los almacenes de datos creados para fines específicos. 

    Ejemplo: pueden copiar en el servicio de búsqueda los datos del catálogo de productos almacenados en su base de datos para facilitar la búsqueda en su catálogo de productos y aliviar las consultas de búsqueda de la base de datos.

    Traslado de datos desde el exterior hacia el interior
  • Gravedad de los datos
  • Gravedad de los datos

    A medida que los datos en estos lagos de datos y almacenes creados para fines específicos crecen, se hace más difícil trasladar todos estos datos porque los datos tienen gravedad. Es igualmente importante garantizar que los datos puedan llegar fácilmente a donde se necesitan, con los controles adecuados, para permitir el análisis y la obtención de información.

    Gravedad de los datos

Los pilares del enfoque de Lake House

Las organizaciones se encuentran en el proceso de recopilar los datos a partir de varios silos para agruparlos en un solo lugar y realizar actividades de análisis y machine learning sobre esos datos. Para obtener el máximo valor, es preciso aprovechar un enfoque de Lake House que permita trasladar los datos entre los lagos de datos y los almacenes de datos creados para fines específicos con facilidad. Esta forma moderna de arquitectura requiere lo siguiente:

Más clientes crean Lake Houses en AWS que en cualquier otro sitio

  • lake_house_customers_logo_bmw
  • lake_house_customers_logo_nielsen
  • lake_house_customers_logo_engie
  • Grupo BMW
  • Grupo BMW
    Grupo BMW

    Para acelerar la innovación y democratizar el uso de los datos a escala, el Grupo BMW migró su lago de datos en las instalaciones a uno con tecnología de Amazon S3; BMW ahora procesa TB de datos de telemetría de millones de vehículos diariamente y resuelve los problemas antes de que afecten a los clientes.

    Lea el caso práctico 
  • Nielsen
  • Nielsen
    Nielsen

    Nielsen, una empresa global de medición y análisis de datos, aumentó drásticamente la cantidad de datos que puede capturar, procesar y presentar a sus clientes todos los días mediante el uso de una moderna tecnología en la nube. Pasó de medir 40 000 hogares diarios a más de 30 millones.

    Lea el caso práctico 
  • Engie
  • Engie
    lake_house_customers_logo_engie

    ENGIE es una de las principales empresas de servicios públicos de Francia, con 160 000 empleados y 40 unidades de negocio que operan en 70 países. Su lago de datos de casi 100 TB de Common Data Hub utiliza los servicios de AWS para satisfacer las necesidades empresariales en ciencia de datos, marketing y operaciones.

    Lea el caso práctico 

Socios

Descubra cómo nuestros socios ayudan a las organizaciones a crear una arquitectura de datos moderna mediante el enfoque de Lake House en AWS.

Cloudera

Cloudera

Ejecutar Cloudera Enterprise en AWS proporciona a los usuarios empresariales y de TI una plataforma de administración de datos que puede actuar como base para el procesamiento y el análisis de datos modernos.

Más información »

Informatica Cloud

Informatica Cloud

Informatica Cloud proporciona integración optimizada para los servicios de datos de AWS con conectividad nativa a más de 100 aplicaciones.

Más información »

Dataguise

Dataguise

Dataguise es el líder en ejecución segura de negocios, ya que entrega soluciones de seguridad centradas en los datos que detectan y protegen los datos confidenciales de las empresas, sin importar dónde estén ubicados ni quién necesite utilizarlos.

Más información »

Alluxio Data Orchestration

Alluxio Data Orchestration

Alluxio Data Orchestration permite a los clientes aprovechar mejor los servicios clave de AWS, como EMR y S3 para las cargas de trabajo de análisis e IA.

Más información »

Introducción

Programa AWS Data-Driven Everything

AWS Data-Driven Everything
En el programa AWS Data-Driven EVERYTHING (D2E), AWS se asociará con nuestros clientes para moverse más rápido, con mayor precisión y con un alcance mucho más ambicioso para poner en marcha su propio volante de inercia de datos.

Más información »

AWS Data Lab

AWS Data Lab
AWS Data Lab ofrece compromisos de ingeniería conjuntos y acelerados entre los clientes y los recursos técnicos de AWS para generar resultados tangibles que agilicen las iniciativas de modernización de análisis y datos.

Más información »

Arquitectura de referencia de big data y análisis de AWS

Arquitectura de referencia de big data y análisis de AWS
Conozca las prácticas recomendadas de arquitectura para el análisis de datos en la nube, el almacén de datos y la gestión de datos en AWS.

Más información »