Lagos de datos en AWS
Cree, pruebe e implemente rápidamente su lago de datos con las soluciones de AWS y de sus socios.
Información general
Las herramientas tradicionales de almacenamiento y análisis de datos ya no pueden proporcionar la agilidad y la flexibilidad necesarias para ofrecer información empresarial relevante. Es por eso que muchas organizaciones están optando por una arquitectura de lago de datos. Con los inicios rápidos de lago de datos y las soluciones listas para los clientes, AWS y los socios con las competencias pertinentes agilizan y simplifican la creación de su lago de datos. Un lago de datos es un enfoque arquitectónico que le permite almacenar grandes cantidades de datos en una ubicación central, de modo que estén disponibles para que los categoricen, procesen, analicen y consuman distintos grupos dentro de una organización. Como los datos se pueden almacenar tal como están, no es necesario convertirlos a un esquema predefinido y ya no es necesario saber de antemano qué preguntas desea hacer sobre sus datos.
Un lago de datos en AWS puede ser de ayuda para:
-
Recopilar y almacenar cualquier tipo de datos, a cualquier escala y a bajo costo
-
Proteger los datos y evitar el acceso no autorizado
-
Catalogar, buscar y encontrar los datos relevantes en el repositorio central
-
Realizar nuevos tipos de análisis de datos de forma rápida y sencilla
-
Usar un amplio conjunto de motores de análisis para análisis ad hoc, transmisión en tiempo real, análisis predictivo, inteligencia artificial (IA) y machine learning
Un lago de datos también puede complementar y ampliar su almacenamiento de datos existente. Si ya usa un almacenamiento de datos o está pensando en implementar uno, un lago de datos puede usarse como origen de datos tanto estructurados como no estructurados.
Creación de un lago de datos en AWS
Ventajas de un lago de datos en AWS
-
Capture datos fácilmente de diversas formas, incluida la utilización de Amazon Kinesis, AWS Import/Export Snowball, AWS Direct Connect y más. Almacene todos los datos, independientemente del volumen o formato, con Amazon Simple Storage Service (Amazon S3).
-
Implemente la infraestructura que necesita prácticamente al instante. Gracias a ello, sus equipos pueden incrementar su productividad, resulta más sencillo probar cosas nuevas y los proyectos se pueden poner en marcha antes.
-
AWS proporciona capacidades en instalaciones, redes, software y procesos empresariales para satisfacer los requisitos más exigentes. Se realizan auditorías de los entornos constantemente, de acuerdo con certificaciones como ISO 27001, FedRAMP, DoD SRG y PCI DSS.
-
Cree prácticamente cualquier aplicación de macrodatos y admita cualquier carga de trabajo independientemente del volumen, la velocidad y la variedad de los datos. Con más de 50 servicios y cientos de características agregadas todos los años, AWS proporciona todo lo necesario para recopilar, almacenar, procesar, analizar y visualizar macrodatos en la nube.
Descargue el libro electrónico
Descubra cómo AWS y los socios con competencias de APN ayudaron organizaciones a migrar grandes volúmenes de datos heterogéneos a un lago de datos en AWS, donde pueden aprovecharlos de forma rápida y sencilla para obtener información empresarial crítica.
Socios tecnológicos destacados de APN
Attunity
Fanatics, un popular sitio web de ropa deportiva y comercializador de artículos para aficionados, necesitaba ingerir terabytes de datos de varios orígenes históricos y de transmisión (sistemas transaccionales, de comercio electrónico y administrativos) hacia un lago de datos en Amazon S3. Una vez ingeridos, los datos se analizarían para identificar, predecir y satisfacer mejor las necesidades de los clientes relacionadas con los productos que Fanatics ofrece en más de 300 tiendas en línea y físicas.
Para lograrlo, Fanatics eligió Attunity Replicate, una solución de software con captura de datos continua (CDC) y procesamiento en paralelo para transmitir datos en tiempo real desde varios orígenes hacia un lago de datos en Amazon S3. Luego, los datos se pueden consumir en Apache Kafka para realizar análisis en tiempo real. Attunity ayuda a Fanatics a eliminar la pesada carga de extraer datos manualmente de fuentes dispares y permite a la organización ver los resultados en tiempo real.
Título del seminario web: Fanatics ingiere datos de transmisión en un lago de datos en AWS
Presentador del cliente: Alan Chang, gerente sénior de productos de Fanatics
Presentador de Attunity: Jordan Martz, director de tecnología
Presentador de AWS: Paul Sears, arquitecto de soluciones
Databricks
La puesta en marcha de cargas de trabajo de ciencia de datos con datos de orígenes dispares (lago de datos, almacenamiento de datos, transmisión y más) genera desafíos para las organizaciones que necesitan usar sus datos para impulsar mejoras operativas y de productos. La editorial de libros de textgo McGraw-Hill tenía que eliminar estos silos de datos para poder transformar su modelo de negocio y adaptarse a un creciente enfoque en el aprendizaje digital. En concreto, la empresa quería poder realizar operaciones de análisis complejas con rapidez y habilitar la colaboración entre analistas de negocio, ingenieros de datos y científicos de datos.
McGraw-Hill implementó Databricks, una plataforma de análisis unificada que le permite trabajar eficientemente con datos de transmisión, así como con datos históricos almacenados en lagos de datos en Amazon S3 y en múltiples almacenamientos de datos. En este seminario web, aprenderá cómo Databricks, desarrollado por los creadores originales de Apache Spark™, permite a McGraw-Hill analizar datos de transmisión e históricos a una escala y velocidad que su solución anterior simplemente no podía proporcionar. Las cargas de trabajo de ciencia de datos que antes llevaban semanas, ahora llevan horas.
Título del seminario web: McGraw-Hill optimiza las cargas de trabajo de análisis con Databricks
Presentador del cliente: Matthew Ashbourne, ingeniero de software principal de McGraw-Hill Education
Presentador de Databricks: Brian Dirking, director sénior de marketing para socios
Presentador de AWS: Pratap Ramamurthy, arquitecto de soluciones para socios
Qubole
Las tecnologías de macrodatos pueden ser complejas e incluir procesos manuales arduos. Las organizaciones que automatizan de forma inteligente las operaciones de macrodatos reducen sus costos, hacen que sus equipos sean más productivos, escalan con mayor eficiencia y reducen el riesgo de fallos.
En nuestro seminario web, representantes de TiVo, creador de una plataforma de grabación digital para contenido televisivo, explicarán cómo implementaron una nueva plataforma de macrodatos y análisis que escala de forma dinámica en respuesta a los cambios en la demanda. Descubrirá cómo la solución permite a TiVo orquestar fácilmente clústeres demacrodatos usando Amazon Elastic Cloud Compute (Amazon EC2) e instancias de spot de Amazon EC2 que leen datos de un lago de datos en Amazon Simple Storage Service (Amazon S3), y cómo esto reduce el costo y el esfuerzo de desarrollo necesarios para dar soporte a sus usuarios de red y anunciantes. TiVo compartirá las lecciones aprendidas y las prácticas recomendadas para ingerir, procesar y poner a disposición para el análisis, de forma rápida y económica, terabytes de datos de visualización de transmisión y por lotes de millones de hogares.
Título del seminario web: TiVo: cómo escalar nuevos productos con un lago de datos en AWS y Qubole
Presentador del cliente: Ashish Mrig, gerente sénior de análisis de macrodatos de TiVo
Presentador de Qubole: Harsh Jetly, arquitecto de soluciones
Presentador de AWS: Paul Sears, arquitecto de soluciones
Talend
Descubra cómo puede reducir los plazos de desarrollo e innovar en AWS. En este seminario web, Beachbody (vendedores de videos de ejercicio en casa para mejorar la condición física, perder peso y desarrollar músculo) habla sobre su experiencia de migración a una arquitectura de lago de datos en AWS con Talend. Beachbody describirá cómo crearon una plataforma de datos empresariales abierta que brinda a sus empleados acceso a datos seguros y bien gobernados, y aumenta la eficiencia de DevOps en toda la empresa.
Únase a nuestro seminario web y descubra cómo Talend y AWS ayudaron a Beachbody a migrar una variedad de fuentes de datos no estructurados y estructurados a un lago de datos, acortar los ciclos de desarrollo y pruebas, y resolver los complejos desafíos de implementación habituales con datos en tiempo real.
Título del seminario web: Arquitectura de un lago de datos abierto para la empresa
Presentador de Talend: Ashwin Viswanath, director de marketing de productos en la nube
Presentador del cliente: Eric Anderson, director ejecutivo de datos de Beachbody
Presentador de AWS: Pratap Ramamurthy, arquitecto de soluciones
Informatica
La solución Informatica Intelligent Data Lake Management le permite ingerir, limpiar, procesar, gobernar y proteger grandes volúmenes de datos sin procesar en un lago de datos de confianza en AWS. Las capacidades de IA basada en metadatos y catalogación empresarial de Informatica permiten a las partes interesadas del negocio, como los analistas, descubrir, perfilar, preparar y proteger datos con rapidez para obtener información empresarial oportuna y relevante. En resumen, Informatica permite a las empresas aprovechar el poder de un lago de datos en AWS y liberar la información de macrodatos que ayuda a impulsar la innovación y las ventas.
Looker
Las empresas actuales funcionan con macrodatos, y las métricas generadas por esos datos deben estar definidas de forma centralizada y ser totalmente accesibles para ser de verdadero beneficio. La solución actual es Looker, una plataforma de datos moderna que permite a todos en la empresa encontrar y explorar los datos que necesitan para tomar decisiones. Looker está desarrollado para plataformas en la nube como Amazon Web Services (AWS) y le permite consultar bases de datos modernas en la nube como los lagos de datos directamente. Los clientes utilizan Looker para realizar análisis internos, así como para exponer datos a clientes, socios y proveedores.
Socios consultores destacados de APN
Optimice la implementación de un lago de datos en la nube con AWS y Talend.
Tenga la tranquilidad de contar con el proceso probado de tres pasos de Cloudwick para diseñar y administrar lagos de datos en AWS.
Aproveche la experiencia y la profunda alineación de NorthBay con AWS para crear su solución personalizada de lago de datos.