El uso compartido de datos de Amazon Redshift permite ampliar la facilidad de uso, el rendimiento y los beneficios en materia de costos que ofrece Amazon Redshift en un solo clúster a las implementaciones de varios clústeres, a la vez que se pueden compartir los datos. El uso compartido de datos permite el acceso instantáneo, pormenorizado y rápido a los datos en todos los clústeres de Amazon Redshift sin necesidad de copiarlos o trasladarlos. El uso compartido de datos proporciona acceso en directo a los datos para que los usuarios siempre vean la información más actualizada y coherente a medida que esta se actualiza en el almacenamiento de datos. De forma segura, puede compartir datos en vivo con clústeres de Amazon Redshift en la misma cuenta de AWS o también en diferentes.

El uso compartido de datos de Amazon Redshift proporciona:

  1. Una forma sencilla y directa de compartir datos entre los almacenes de datos de Amazon Redshift
  2. Acceso instantáneo, detallado y de alto rendimiento, sin necesidad de copias ni traslados de datos.
  3. Vistas de los datos en directo y coherentes con las transacciones para todos los consumidores.
  4. Colaboración segura y gobernada dentro y entre organizaciones y partes externas.
 
El uso compartido de datos entre cuentas de Amazon Redshift está disponible de manera general.
 
El uso compartido de datos en los clústeres de Amazon Redshift no conlleva ningún costo adicional.
Amazon Redshift Data Sharing workflow (8:53)
El uso compartido de datos se basa en el almacenamiento administrado de Amazon Redshift RA3, que desacopla el almacenamiento y la informática, lo que permite que cualquiera de ellos escale de forma independiente. Con el uso compartido de datos, las cargas de trabajo que acceden a los datos compartidos están aisladas unas de otras. Las consultas que acceden a los datos compartidos se ejecutan en el clúster consumidor y leen los datos de la capa de almacenamiento administrado de Amazon Redshift directamente sin afectar al rendimiento del clúster productor. Ahora puede incorporar rápidamente cualquier cantidad de cargas de trabajo con diversos patrones de acceso a los datos y requisitos de acuerdos de nivel de servicio sin preocuparse por la contención de recursos. Las cargas de trabajo que acceden a los datos compartidos se pueden aprovisionar con recursos informáticos flexibles que cumplan los requisitos de rendimiento de precio específicos de la carga de trabajo y que se escalen de forma independiente según sea necesario de manera autoservicio.

Cómo funciona

Cómo funciona el uso compartido de datos de Redshift

Casos de uso

  • Aislamiento de la carga de trabajo y habilidad de carga
  • Colaboración entre grupos
  • Datos y análisis como servicio
  • Agilidad de desarrollo
  • Aislamiento de la carga de trabajo y habilidad de carga
  • Aislamiento de la carga de trabajo y habilidad de carga

    Comparta los datos de un clúster de ETL con varios clústeres de inteligencia empresarial y de análisis aislados en una arquitectura tipo hub-spoke para proporcionar un aislamiento de la carga de trabajo de lectura y una devolución de carga opcional para gestionar los gastos. Se puede ajustar el tamaño de cada clúster de análisis en función de los requisitos de rendimiento en cuanto a precios. Además, se pueden incorporar fácilmente nuevas cargas de trabajo.

    Aislamiento de la carga de trabajo y habilidad de carga
  • Colaboración entre grupos
  • Colaboración entre grupos

    Compartir datos entre varios grupos empresariales que mantienen clústeres de Amazo Redshift por separado a fin de colaborar para realizar análisis y procesos de ciencia de datos más amplios. Cada clúster de Amazon Redshift puede actuar como productor de ciertos datos, pero también como consumidor de otros conjuntos de datos.

    Colaboración entre grupos
  • Datos y análisis como servicio
  • Datos y análisis como servicio

    Comparta datos como un servicio entre diferentes grupos de la organización, así como con partes externas fuera de los límites de la organización.

    Datos y análisis como servicio
  • Agilidad de desarrollo
  • Agilidad de desarrollo

    Comparta datos entre los entornos de desarrollo, pruebas y producción, con cualquier nivel de detalle, sin necesidad de tomar instantáneas y restaurarlas por completo.

    Agilidad de desarrollo

Historias de éxito de los clientes

home24

FactSet

“Muchos clientes de FactSet llevan a cabo programas de transformación en la nube y de modernización de la tecnología en un esfuerzo por reducir costos, consolidar sus infraestructuras y proveedores, así como eliminar los datos duplicados. Para satisfacer las necesidades cambiantes de nuestros clientes, FactSet proporciona soluciones flexibles que pueden integrarse sin problemas en una serie de entornos de flujo de trabajo preferidos, incluido AWS Redshift, lo que hace que la adopción y la implementación de nuestro contenido y nuestras soluciones estén listas para funcionar. Al aprovechar las capacidades del uso compartido de datos de Redshift, las fuentes de datos estándar de FactSet están disponibles al instante en el clúster de Redshift de nuestros clientes. Esto les permite subcontratar a FactSet todos los procesos de ETL, lo que da como resultado la optimización de los datos, la reducción del tiempo de comercialización, una integridad de datos más eficiente y un proceso simplificado para el descubrimiento, la vinculación y las pruebas de los datos”.

Namita Jain, propietario del producto, servicios administrados y de la nube

home24

Epsilon

“Antes del uso compartido de datos, intercambiar datos con nuestros clientes mediante Amazon Redshift no era tan eficiente como podría serlo. Por lo general, dos veces a la semana se ponen en marcha dos clústeres adicionales, se restauran, se descargan, se copian, se eliminan esquemas y se conceden privilegios. Gracias al uso compartido de datos, podemos compartirlos con nuestros clientes sin apenas tiempo de inactividad. Con menos de 10 declaraciones SQL, conseguimos de forma segura lo que antes era un proceso mucho más largo. Esta característica nos da más flexibilidad, ahorra tiempo, costos y aumenta la satisfacción del cliente”.

Samantha Corkery, administradora principal de base de datos, Epsilon

Warner Bros.

Warner Bros.

“En Warner Bros. Games, creamos y mantenemos complejas infraestructuras de movilidad de datos para administrar las transferencias de datos entre clústeres de juegos individuales y clústeres de funciones empresariales consolidadas. Sin embargo, desarrollar y mantener este sistema acapara valiosos recursos del equipo y provoca retrasos que obstaculizan nuestra capacidad de actuar sobre los datos con agilidad y rapidez. Mediante la característica de uso compartido de datos de Redshift, podemos eliminar todo el subsistema que creamos para la copia, la transferencia y la carga de datos entre los clústeres de Redshift. Esto permitirá a todos nuestros equipos empresariales tomar decisiones sobre los conjuntos de datos adecuados de forma más rápida y eficaz. Además, el uso compartido de datos de Redshift también nos permitirá rediseñar el aprovisionamiento informático para que se ajuste más a los recursos necesarios para ejecutar las cargas de trabajo SQL de esas funciones, lo que, en definitiva, permitirá simplificar las operaciones de infraestructura”.

Kurt Larson, director técnico - Warner Bros. Análisis

Yelp

Yelp

“La característica de uso compartido de datos permite que varios clústeres de Redshift consulten sin problemas los datos ubicados en nuestros clústeres RA3 y su almacenamiento administrado. Esto elimina nuestra preocupación con respecto a los retrasos a la hora de poner los datos a disposición de nuestros equipos. Además, reduce la cantidad de duplicación de datos y las dificultades de reposición asociadas. Ahora podemos dedicar aún más tiempo a aprovechar nuestros datos en Redshift y permitir una mejor colaboración, en lugar de la organización de los datos”.

Steven Moy, ingeniero - Yelp

Fannie Mae

Fannie Mae

“En Fannie Mae, adoptamos un enfoque descentralizado para la administración del almacén de datos con decenas de clústeres de Amazon Redshift en muchas aplicaciones. Aunque cada equipo administra su propio conjunto de datos, con frecuencia tenemos casos de uso en los que una aplicación necesita consultar los conjuntos de datos de otras aplicaciones y unirse a los datos disponibles localmente. En la actualidad, descargamos y trasladamos los datos de un clúster a otro, lo que provoca retrasos a la hora de proporcionar acceso oportuno a los datos a nuestros equipos. Hemos tenido problemas con las operaciones de descarga que elevan el consumo de recursos en los clústeres productores. El uso compartido de datos nos permite omitir esta descarga intermedia a Amazon S3, lo que ahorra tiempo y reduce el consumo. Muchas aplicaciones actualmente realizan descargas para compartir conjuntos de datos, y planeamos convertir todos esos procesos para que aprovechen la nueva característica de uso compartido de datos. Con el uso compartido de datos, podemos hacer que los datos se compartan sin problemas entre los equipos de aplicaciones y ofrecerles visualizaciones comunes de los datos sin necesidad de realizar operaciones de extracción, transformación y carga (ETL). También podemos evitar las copias de datos entre los entornos de preproducción, investigación y producción de cada aplicación. El uso compartido de datos nos hizo más ágiles y nos dio la flexibilidad para escalar los análisis en entornos altamente distribuidos como Fannie Mae”.

Amy Tseng, administradora de bases de datos empresariales - Fannie Mae

home24

Home24

“El almacenamiento compartido nos permitió centrarnos en lo importante: poner los datos a disposición de los usuarios finales. Los datos ya no están atrapados en una innumerable cantidad de medios o formatos de almacenamiento, o accesibles solo a través de APIs selectas, sino en un único tipo de SQL”.

Marco Couperus, director de ingeniería - home24

Recursos

Blog

Cross-Account Data Sharing for Amazon Redshift

Blog

Compartir los datos de Amazon Redshift de forma segura entre los clústeres de Amazon Redshift para el aislamiento de la carga de trabajo

Blog

Implementación de patrones de varios usuarios en Amazon Redshift mediante el uso compartido de datos

Video

Amazon Redshift Cross-Account Data Sharing

Video

Casos de uso del uso compartido de datos de Amazon Redshift

Video

AWS on air: uso compartido de datos de Amazon Redshift y aislamiento

Video

Amazon Redshift Data Sharing multi-tenant patterns

Introducción a Amazon Redshift

Guía de introducción a Amazon Redshift
Revise la guía de introducción

Siga estos pasos para cargar datos de muestra y empezar analizarlos con Amazon Redshift.

Más información 
Inscríbase para obtener una cuenta gratuita de AWS
Regístrese para obtener una cuenta gratuita

Obtenga acceso instantáneo a la capa gratuita de AWS. 

Regístrese 
Laboratorios de Amazon Redshift
Adquiera experiencia práctica con los laboratorios

Lea consejos y aprenda técnicas para maximizar su experiencia con Amazon Redshift.

Introducción