Amazon Redshift 資料共享

跨倉儲安全地共用資料而無須複製資料

Amazon Redshift 資料共享可讓您將 Amazon Redshift 在單一叢集中提供的易用性、效能和成本優勢擴展至多叢集部署,同時能夠共享資料。資料共享可跨 Amazon Redshift 叢集實現即時、精細和快速資料存取,而無需對其複製或移動。資料共享可即時存取資料,以便您的使用者在資料倉儲中更新時,始終能看到最新且一致的資訊。您可以在相同或不同的 AWS 帳戶中以及跨區域,與 Amazon Redshift 叢集安全地共享即時資料。

Amazon Redshift 資料共享具有以下優勢:

  1. 在 Amazon Redshift 資料倉儲之間共享資料的簡單且直接的方法
  2. 即時、精細和高效能存取,無需資料複製和資料移動。
  3. 所有取用者之間即時且交易一致的資料檢視。
  4. 在組織和外方內部和之間進行安全且受管控的協作。
Amazon Redshift 跨帳戶資料共享現已正式推出。
 
在您的 Amazon Redshift 叢集上使用資料共享無需額外費用。
Amazon Redshift 資料共享 (1:16)
資料共享在 Amazon Redshift RA3 受管儲存的基礎上建置,其將儲存與運算解偶,從而允許其中任一個獨立擴展。透過資料共享,存取共享資料的工作負載會彼此隔離。存取共享資料的查詢在取用者叢集上執行,並直接從 Amazon Redshift 受管儲存層讀取資料,而不會影響生產者叢集的效能。現在,您可以快速處理具有多種資料存取模式和 SLA 要求的任何數量的工作負載,而不必擔心資源爭用。可以使用靈活的運算資源來佈建存取共享資料的工作負載,這可滿足其工作負載特定的性價比要求,並且可以視需以自助方式獨立擴展。

運作方式

Redshift 資料共享運作方式

使用案例

  • 工作負載隔離和計費選項
  • 工作負載隔離和計費選項

    在中心輻射型架構中,與多個隔離的 BI 和分析叢集共享 ETL 叢集中的資料,以提供讀取工作負載隔離和選用的計費方式。可以根據其性價比要求,調整每個分析叢集的大小,並且可以輕鬆地布設新的工作負載。

    工作負載隔離和計費選項
  • 跨群組協作
  • 跨群組協作

    在多個業務群組之間共享資料,其各自維護單獨的 Amazo Redshift 叢集,相互協作以實現更廣泛的分析和資料科學。每個 Amazon Redshift 叢集可以是某些資料的生產者,也可以是其他資料集的取用者。

    跨群組協作
  • 資料和分析即服務
  • 資料和分析即服務

    在組織中的不同群組之間,以及與組織範圍外的外部方共享資料即服務。

    資料和分析即服務
  • 發展敏捷性
  • 發展敏捷性

    在開發、測試和生產環境之間以任何精細度共享資料,而不必拍攝快照並對其完全還原。

    發展敏捷性

客戶成功案例

home24

FactSet

「許多 FactSet 客戶正在實施雲端轉型和技術現代化計劃,以降低成本,合併基礎設施和廠商,並消除重複資料。為了滿足客戶不斷變化的需求,FactSet 提供了靈活的解決方案,可以無縫整合到包括 AWS Redshift 在內的許多偏好的工作流程環境中,從而立即採用和實作我們的內容和解決方案。透過利用 Redshift 的資料共享功能,FactSet 標準資料饋送可立即在我們客戶的 Redshift 叢集中使用。這可讓他們將所有 ETL 流程外包給 FactSet,從而簡化資料,縮短上市時間,提高有效的資料完整性,簡化資料探索、連結和測試的流程。」

雲端和受管服務產品負責人 Namita Jain

home24

Epsilon

「在資料共享之前,我們使用 Amazon Redshift 與客戶交換資料的過程並沒有達到應有的效率。我們通常每週啟動兩次額外的叢集、還原、卸載、複製、捨棄結構描述,並授予權限。使用資料共享,我們可以在幾乎沒有停機時間的情况下與客戶共享資料。使用不到 10 條 SQL 陳述式,我們安全地實現了過去需要更長的程序。此功能為我們提供了更大的靈活性,節省了時間和成本,並提高了客戶滿意度。」

Epsilon 資料庫首席管理員 Samantha Corkery

Warner Bros.

Warner Bros.

「在 Warner Bros.針對遊戲,我們建置並維護複雜的資料移動​​性基礎架構,以管理單一遊戲叢集和合併的業務功能叢集之間的資料移動。但是,開發和維護該系統會壟斷寶貴的團隊資源,並會導致延遲,從而阻礙我們以敏捷和快速的方式對資料進行操作的能力。使用 Redshift 資料共享功能,我們可以移除為 Redshift 叢集之間的資料複製、移動和載入而建置的整個子系統。這將使我們所有的業務團隊能夠更快、更有效地對正確的資料集做出決策。此外,Redshift 資料共享還將讓我們能夠重新設計運算佈建,以便與執行這些功能的 SQL 工作負載所需的資源更加緊密地結合,從而最終實現更簡單的基礎架構操作。」

Warner Bros. 技術總監 Kurt Larson分析

Yelp

Yelp

「資料共享功能允許多個 Redshift 叢集無縫地查詢位於我們 RA3 叢集及其受管儲存體中的資料。這消除了我們對延遲為團隊提供資料的擔憂,並減少了資料重複的數量和相關的回填難題。現在,我們可以集中更多的時間,在 Redshift 中利用我們的資料,並實現更好的協作而不是資料協同。」

Yelp 工程師 Steven Moy

Fannie Mae

Fannie Mae

「在 Fannie Mae,我們採用分散式方法來管理多個應用程式中數十個 Amazon Redshift 叢集,從而進行資料倉儲管理。在每個團隊管理自己資料集的同時,我們經常遇到這樣的使用案例,其中應用程式需要從其他應用程式查詢資料集,並與本機可用資料結合。目前,我們正在將資料從一個叢集卸載,並將其移至另一個叢集,這在向我們的團隊提供及時存取資料方面產生了延遲。我們遇到了問題,即卸載操作讓生產者叢集上的資源消耗激增,而資料共享讓我們能夠跳過此中繼卸載到 Amazon S3 的程序,從而節省了時間並降低了消耗。目前,許多應用程式正在執行卸載以共享資料集,並且我們計劃將所有此類程序轉換為充分利用新的資料共享功能。透過資料共享,我們可以實現跨應用程式團隊的無縫資料共享,並為他們提供通用的資料檢視,而無需執行 ETL。我們還能夠避免針對每個應用程式,在預生產、研究和生產環境之間複製資料。資料共享讓我們更加敏捷,並使我們靈活地在 Fannie Mae 等高度分散式環境中擴展分析。」

Fannie Mae 企業資料庫經理 Amy Tseng

home24

Home24

「共享儲存讓我們能夠專注於重要的事情:讓資料可供最終使用者取用。資料不再卡在無數種儲存介質或格式中,也不再僅透過某些 API 進行存取,而是採用一種 SQL 來存取。」

home24 工程經理 Marco Couperus

資源

部落格

Amazon Redshift 的跨帳戶資料共享 (Cross-Account Data Sharing for Amazon Redshift)

部落格

跨 Amazon Redshift 叢集安全地共享 Amazon Redshift 資料以隔離工作負載

部落格

使用資料共享在 Amazon Redshift 中實作多租用戶模式

影片

Amazon Redshift Cross-Account Data Sharing

影片

Amazon Redshift 資料共享使用案例

影片

AWS On Air:Amazon Redshift 資料共享與隔離

影片

Amazon Redshift 資料共享多租用戶模式