Arquitectura de datos moderna en AWS

Integre sin problemas el lago de datos, el almacenamiento de datos y los almacenes de datos creados para fines específicos

Funcionamiento de la arquitectura de datos moderna

La arquitectura de datos moderna parte del principio de que la adopción de un enfoque único para el análisis con el tiempo conlleva riesgos. No se trata simplemente de integrar un lago de datos con un almacenamiento de datos, sino de integrar un lago de datos, un almacenamiento de datos y almacenes creados para fines específicos, con lo que se consigue una gobernanza unificada y una fácil transferencia de datos. Gracias a una arquitectura de datos moderna en AWS, los clientes pueden crear con rapidez lagos de datos escalables, utilizar una amplia y exhaustiva variedad de servicios de datos personalizados, garantizar el cumplimiento mediante acceso a datos, seguridad y gobernanza unificados, escalar sus sistemas a bajo coste sin poner en riesgo el rendimiento y compartir de manera sencilla datos en toda la organización, de modo que pueden tomar decisiones con velocidad y agilidad a escala.

Cómo funciona: arquitectura de datos moderna

Por qué necesita una arquitectura de datos moderna

Los volúmenes de datos aumentan a un ritmo sin precedentes, de terabytes a petabytes y a veces a exabytes. Los enfoques tradicionales de análisis de datos en las instalaciones no pueden gestionar estos volúmenes de datos porque no son lo suficientemente escalables y resultan demasiado caros. Varias empresas se encuentran en el proceso de recopilar todos sus datos a partir de diversos silos para agruparlos en un solo lugar, que muchos denominan lago de datos, para realizar análisis y ML directamente sobre esos datos. En otras ocasiones, estas mismas empresas almacenan otros datos en almacenes de datos creados para fines específicos y así poder analizar y obtener rápidamente información a partir de datos estructurados y no estructurados. Este traslado de datos puede ser “desde el interior hacia el exterior”, “desde el exterior hacia el interior”, “alrededor del perímetro” o “uso compartido” porque los datos tienen gravedad.

  • Desde el interior hacia el exterior
  • Traslado de datos desde el interior hacia el exterior

    Los clientes almacenan los datos en un lago de datos y luego trasladan una parte de esos datos a un almacén de datos creado para fines específicos en el que se realizan actividades adicionales de machine learning o análisis.

    Ejemplo: los datos de secuencias de clics de las aplicaciones web se pueden recopilar directamente en un lago de datos, y una parte de esos datos se puede trasladar a un almacenamiento de datos para la elaboración de informes diarios. Denominamos a este concepto como traslado de datos desde el interior hacia el exterior.

    Traslado de datos desde el interior hacia el exterior
  • Desde el exterior hacia el interior
  • Traslado de datos desde el exterior hacia el interior

    Los clientes almacenan los datos en almacenes de datos creados para fines específicos, como un almacenamiento de datos o una base de datos, y trasladan esos datos a un lago de datos para realizar análisis sobre ellos. 

    Ejemplo: copian en su lago de datos los resultados de las consultas sobre las ventas de productos en una región determinada a partir de un almacenamiento de datos para ejecutar algoritmos de recomendación de productos en un conjunto de datos más amplio mediante ML.

    Traslado de datos desde el exterior hacia el interior
  • Alrededor del perímetro
  • Traslado de datos alrededor del perímetro

    Integre sin problemas el lago de datos, el almacenamiento de datos y los almacenes de datos creados para fines específicos. 

    Ejemplo: pueden copiar en el servicio de búsqueda los datos del catálogo de productos almacenados en su base de datos para facilitar la búsqueda en su catálogo de productos y aliviar las consultas de búsqueda de la base de datos.

    Traslado de datos desde el exterior hacia el interior
  • Uso compartido
  • Traslado de datos de uso compartido

    Los clientes utilizan una arquitectura de datos moderna para facilitar la gobernanza y el uso compartido de datos dentro de fronteras de gobernanza lógicas o físicas para crear dominios de datos en consonancia con las líneas de negocio

    Traslado de datos de uso compartido
  • Gravedad de los datos
  • Gravedad de los datos

    A medida que los datos en estos lagos de datos y almacenes creados para fines específicos crecen, se hace más difícil trasladar todos estos datos porque los datos tienen gravedad. Es igualmente importante garantizar que los datos puedan llegar fácilmente a donde se necesitan, con los controles adecuados, para permitir el análisis y la obtención de información.

    Gravedad de los datos

Pilares de la arquitectura de datos moderna

Las organizaciones se encuentran en el proceso de recopilar los datos a partir de varios silos para agruparlos en un solo lugar y realizar actividades de análisis y machine learning sobre esos datos. Para obtener el máximo valor, es preciso aprovechar una arquitectura de datos moderna que permita trasladar los datos entre los lagos y los almacenes de datos creados para fines específicos con facilidad. Esta forma moderna de arquitectura requiere lo siguiente:

Más clientes están beneficiándose de una arquitectura de datos moderna en AWS que en cualquier otro sitio

  • Grupo BMW
  • Grupo BMW
    Grupo BMW

    Para acelerar la innovación y democratizar el uso de los datos a escala, el Grupo BMW migró su lago de datos en las instalaciones a uno con tecnología de Amazon S3; BMW ahora procesa TB de datos de telemetría de millones de vehículos diariamente y resuelve los problemas antes de que afecten a los clientes.

    Lea el caso práctico 
  • Nielsen
  • Nielsen
    Nielsen

    Nielsen, una empresa global de medición y análisis de datos, aumentó drásticamente la cantidad de datos que puede capturar, procesar y presentar a sus clientes todos los días mediante el uso de una moderna tecnología en la nube. Pasó de medir 40 000 hogares diarios a más de 30 millones.

    Lea el caso práctico 
  • Engie
  • Engie

    ENGIE es una de las principales empresas de servicios públicos de Francia, con 160 000 empleados y 40 unidades de negocio que operan en 70 países. Su lago de datos de casi 100 TB de Common Data Hub utiliza los servicios de AWS para satisfacer las necesidades empresariales en ciencia de datos, marketing y operaciones.

    Lea el caso práctico 

Socios

Descubra cómo nuestros socios ayudan a las organizaciones a crear una arquitectura de datos moderna en AWS.

Cloudera

Cloudera

Ejecutar Cloudera Enterprise en AWS proporciona a los usuarios empresariales y de TI una plataforma de administración de datos que puede actuar como base para el procesamiento y el análisis de datos modernos.

Más información »

Informatica Cloud

Informatica Cloud

Informatica Cloud proporciona integración optimizada para los servicios de datos de AWS con conectividad nativa a más de 100 aplicaciones.

Más información »

Dataguise

Dataguise

Dataguise es el líder en ejecución segura de negocios, ya que entrega soluciones de seguridad centradas en los datos que detectan y protegen los datos confidenciales de las empresas, sin importar dónde estén ubicados ni quién necesite utilizarlos.

Más información »

Alluxio Data Orchestration

Alluxio Data Orchestration

Alluxio Data Orchestration permite a los clientes aprovechar mejor los servicios clave de AWS, como EMR y S3 para las cargas de trabajo de análisis e IA.

Más información »

Introducción

Programa AWS Data-Driven Everything

AWS Data-Driven Everything
En el programa AWS Data-Driven EVERYTHING (D2E), AWS se asociará con nuestros clientes para moverse más rápido, con mayor precisión y con un alcance mucho más ambicioso para poner en marcha su propio volante de inercia de datos.

Más información »

AWS Data Lab

AWS Data Lab
AWS Data Lab ofrece compromisos de ingeniería conjuntos y acelerados entre los clientes y los recursos técnicos de AWS para generar resultados tangibles que agilicen las iniciativas de modernización de análisis y datos.

Más información »

Arquitectura de referencia de big data y análisis de AWS

Arquitectura de referencia de big data y análisis de AWS
Conozca las prácticas recomendadas de arquitectura para el análisis de datos en la nube, el almacén de datos y la gestión de datos en AWS.

Más información »