El uso compartido de datos de Amazon Redshift permite ampliar la facilidad de uso, el rendimiento y los beneficios en materia de costos que ofrece Amazon Redshift en un solo clúster a las implementaciones de varios clústeres, a la vez que se pueden compartir los datos. El uso compartido de datos permite el acceso instantáneo, pormenorizado y rápido a los datos en todos los clústeres de Amazon Redshift sin necesidad de copiarlos o trasladarlos. El uso compartido de datos proporciona acceso en directo a los datos para que los usuarios siempre vean la información más actualizada y coherente a medida que esta se actualiza en el almacenamiento de datos. Puede compartir datos en directo de forma segura con los clústeres de Amazon Redshift que se encuentren en la misma cuenta de AWS o en cuentas diferentes y entre regiones.
El uso compartido de datos de Amazon Redshift proporciona:
- Una forma sencilla y directa de compartir datos entre los almacenes de datos de Amazon Redshift
- Acceso instantáneo, detallado y de alto rendimiento, sin necesidad de copias ni traslados de datos.
- Vistas de los datos en directo y coherentes con las transacciones para todos los consumidores.
- Colaboración segura y gobernada dentro y entre organizaciones y partes externas.
Cómo funciona

Casos de uso
-
Aislamiento de la carga de trabajo y habilidad de carga
-
Colaboración entre grupos
-
Datos y análisis como servicio
-
Agilidad de desarrollo
-
Aislamiento de la carga de trabajo y habilidad de carga
-
Aislamiento de la carga de trabajo y habilidad de carga
Comparta los datos de un clúster de ETL con varios clústeres de inteligencia empresarial y de análisis aislados en una arquitectura tipo hub-spoke para proporcionar un aislamiento de la carga de trabajo de lectura y una devolución de carga opcional para gestionar los gastos. Se puede ajustar el tamaño de cada clúster de análisis en función de los requisitos de rendimiento en cuanto a precios. Además, se pueden incorporar fácilmente nuevas cargas de trabajo.
-
Colaboración entre grupos
-
Colaboración entre grupos
Compartir datos entre varios grupos empresariales que mantienen clústeres de Amazo Redshift por separado a fin de colaborar para realizar análisis y procesos de ciencia de datos más amplios. Cada clúster de Amazon Redshift puede actuar como productor de ciertos datos, pero también como consumidor de otros conjuntos de datos.
-
Datos y análisis como servicio
-
Datos y análisis como servicio
Comparta datos como un servicio entre diferentes grupos de la organización, así como con partes externas fuera de los límites de la organización.
-
Agilidad de desarrollo
-
Agilidad de desarrollo
Comparta datos entre los entornos de desarrollo, pruebas y producción, con cualquier nivel de detalle, sin necesidad de tomar instantáneas y restaurarlas por completo.
Historias de éxito de los clientes

FactSet
“Muchos clientes de FactSet llevan a cabo programas de transformación en la nube y de modernización de la tecnología en un esfuerzo por reducir costos, consolidar sus infraestructuras y proveedores, así como eliminar los datos duplicados. Para satisfacer las necesidades cambiantes de nuestros clientes, FactSet proporciona soluciones flexibles que pueden integrarse sin problemas en una serie de entornos de flujo de trabajo preferidos, incluido AWS Redshift, lo que hace que la adopción y la implementación de nuestro contenido y nuestras soluciones estén listas para funcionar. Al aprovechar las capacidades del uso compartido de datos de Redshift, las fuentes de datos estándar de FactSet están disponibles al instante en el clúster de Redshift de nuestros clientes. Esto les permite subcontratar a FactSet todos los procesos de ETL, lo que da como resultado la optimización de los datos, la reducción del tiempo de comercialización, una integridad de datos más eficiente y un proceso simplificado para el descubrimiento, la vinculación y las pruebas de los datos”.
Namita Jain, propietario del producto, servicios administrados y de la nube

Epsilon
“Antes del uso compartido de datos, intercambiar datos con nuestros clientes mediante Amazon Redshift no era tan eficiente como podría serlo. Por lo general, dos veces a la semana se ponen en marcha dos clústeres adicionales, se restauran, se descargan, se copian, se eliminan esquemas y se conceden privilegios. Gracias al uso compartido de datos, podemos compartirlos con nuestros clientes sin apenas tiempo de inactividad. Con menos de 10 declaraciones SQL, conseguimos de forma segura lo que antes era un proceso mucho más largo. Esta característica nos da más flexibilidad, ahorra tiempo, costos y aumenta la satisfacción del cliente”.
Samantha Corkery, administradora principal de base de datos, Epsilon

Warner Bros.
“En Warner Bros. Games, creamos y mantenemos complejas infraestructuras de movilidad de datos para administrar las transferencias de datos entre clústeres de juegos individuales y clústeres de funciones empresariales consolidadas. Sin embargo, desarrollar y mantener este sistema acapara valiosos recursos del equipo y provoca retrasos que obstaculizan nuestra capacidad de actuar sobre los datos con agilidad y rapidez. Mediante la característica de uso compartido de datos de Redshift, podemos eliminar todo el subsistema que creamos para la copia, la transferencia y la carga de datos entre los clústeres de Redshift. Esto permitirá a todos nuestros equipos empresariales tomar decisiones sobre los conjuntos de datos adecuados de forma más rápida y eficaz. Además, el uso compartido de datos de Redshift también nos permitirá rediseñar el aprovisionamiento informático para que se ajuste más a los recursos necesarios para ejecutar las cargas de trabajo SQL de esas funciones, lo que, en definitiva, permitirá simplificar las operaciones de infraestructura”.
Kurt Larson, director técnico - Warner Bros. Análisis

Yelp
“La característica de uso compartido de datos permite que varios clústeres de Redshift consulten sin problemas los datos ubicados en nuestros clústeres RA3 y su almacenamiento administrado. Esto elimina nuestra preocupación con respecto a los retrasos a la hora de poner los datos a disposición de nuestros equipos. Además, reduce la cantidad de duplicación de datos y las dificultades de reposición asociadas. Ahora podemos dedicar aún más tiempo a aprovechar nuestros datos en Redshift y permitir una mejor colaboración, en lugar de la organización de los datos”.
Steven Moy, ingeniero - Yelp

Fannie Mae
“En Fannie Mae, adoptamos un enfoque descentralizado para la administración del almacén de datos con decenas de clústeres de Amazon Redshift en muchas aplicaciones. Aunque cada equipo administra su propio conjunto de datos, con frecuencia tenemos casos de uso en los que una aplicación necesita consultar los conjuntos de datos de otras aplicaciones y unirse a los datos disponibles localmente. En la actualidad, descargamos y trasladamos los datos de un clúster a otro, lo que provoca retrasos a la hora de proporcionar acceso oportuno a los datos a nuestros equipos. Hemos tenido problemas con las operaciones de descarga que elevan el consumo de recursos en los clústeres productores. El uso compartido de datos nos permite omitir esta descarga intermedia a Amazon S3, lo que ahorra tiempo y reduce el consumo. Muchas aplicaciones actualmente realizan descargas para compartir conjuntos de datos, y planeamos convertir todos esos procesos para que aprovechen la nueva característica de uso compartido de datos. Con el uso compartido de datos, podemos hacer que los datos se compartan sin problemas entre los equipos de aplicaciones y ofrecerles visualizaciones comunes de los datos sin necesidad de realizar operaciones de extracción, transformación y carga (ETL). También podemos evitar las copias de datos entre los entornos de preproducción, investigación y producción de cada aplicación. El uso compartido de datos nos hizo más ágiles y nos dio la flexibilidad para escalar los análisis en entornos altamente distribuidos como Fannie Mae”.
Amy Tseng, administradora de bases de datos empresariales - Fannie Mae

Home24
“El almacenamiento compartido nos permitió centrarnos en lo importante: poner los datos a disposición de los usuarios finales. Los datos ya no están atrapados en una innumerable cantidad de medios o formatos de almacenamiento, o accesibles solo a través de APIs selectas, sino en un único tipo de SQL”.
Marco Couperus, director de ingeniería - home24
Recursos
Compartir los datos de Amazon Redshift de forma segura entre los clústeres de Amazon Redshift para el aislamiento de la carga de trabajo
Implementación de patrones de varios usuarios en Amazon Redshift mediante el uso compartido de datos
Introducción a Amazon Redshift

Siga estos pasos para cargar datos de muestra y empezar analizarlos con Amazon Redshift.

Obtenga acceso instantáneo a la capa gratuita de AWS.