AWS 上的資料湖可協助您:
-
以低成本收集與儲存任何類型、任何規模的資料
-
保護資料並防止未經授權的存取
-
在中央儲存庫中編目、搜尋及尋找相關資料
-
快速輕鬆地執行新類型的資料分析
-
使用廣泛的分析引擎進行臨機分析、即時串流、預測分析、人工智慧 (AI) 及機器學習
資料湖也可以補充及擴展您現有的資料倉儲。若您已經在使用資料倉儲,或正在考慮實作,資料湖可以作為結構化與非結構化資料的來源。
AWS 上資料湖的優勢
-
以多種方式輕鬆擷取資料,包括利用 Amazon Kinesis、AWS Import/Export Snowball、AWS Direct Connect 等。使用 Amazon Simple Storage Service (Amazon S3) 存放您的所有資料,無論其數量或格式如何。
-
以近乎即時的速度部署所需的基礎設施。這表示您的團隊可以更有效率、更輕鬆地嘗試新事物,並更快速地推出各種專案。
-
AWS 針對設施、網路、軟體及商業程序提供各種功能,以滿足最嚴苛的需求。持續稽核環境以確保通過 ISO 27001、FedRAMP、DoD SRG 和 PCI DSS 等認證。
-
幾乎可以建置任何巨量資料應用程式,並支援任何工作負載,無論資料的數量、速率和種類為何。AWS 每年增加 50 個以上的服務和數百種功能,其中包含在雲端上收集、存放、處理、分析和視覺化巨量資料所需的任何功能。
下載電子書
了解 AWS 與 APN 能力認證合作夥伴如何協助組織將大量異質資料移轉到 AWS 上的資料湖,在那裡他們可以快速且簡單地利用這些資料獲得關鍵業務洞察。
精選 APN 技術合作夥伴
Attunity
Fanatics 是一個受歡迎的運動服飾網站與粉絲商品零售商,需要將多個歷史和串流來源 (交易、電子商務和後勤系統) 的數 TB 資料匯入 Amazon S3 上的資料湖。一旦擷取完成,這些資料將被分析,以更好地識別、預測及滿足客戶與 Fanatics 在 300 多家線上及離線儲存所提供產品相關的需求。
為此,Fanatics 選擇了 Attunity Replicate,這是一個軟體解決方案,具有連續資料擷取 (CDC) 和平行執行緒功能,可將來自多個來源的資料即時串流到 Amazon S3 上的資料湖。然後這些資料可以在 Apache Kafka 中供即時分析使用。Attunity 協助 Fanatics 避免手動從不同來源提取資料的繁重工作,並使組織能夠即時看到結果。
網路研討會標題:Fanatics 將串流資料導入 AWS 上的資料湖
客戶主講人:Alan Chang,Fanatics 資深產品經理
Attunity 主講人:Jordan Martz,技術總監
AWS 主講人:Paul Sears,解決方案架構師
Databricks
對來自不同來源 (資料湖、資料倉儲、串流等) 的資料執行資料科學工作負載,為需要使用其資料來推動營運與產品改善的組織帶來了挑戰。教科書出版商 McGraw-Hill 需要消除這些資料孤島,以便轉變其商業模式,適應對數位學習日益增長的重視。具體來說,該公司希望能夠快速執行複雜的分析操作,並促進業務分析師、資料工程師與資料科學家之間的協作。
McGraw-Hill 部署了 Databricks,這是一個統一的分析平台,使其能夠高效處理串流資料以及儲存在 Amazon S3 資料湖和多個資料倉儲中的歷史資料。在此網路研討會中,您將了解由 Apache Spark™ 原始創建者開發的 Databricks,如何使 McGraw-Hill 能夠以先前解決方案無法提供的規模與速度分析串流及歷史資料。過去需要數週的資料科學工作負載,現在只需數小時。
網路研討會標題:McGraw-Hill 使用 Databricks 最佳化分析工作負載
客戶主講人:Matthew Ashbourne,McGraw-Hill Education 首席軟體工程師
Databricks 主講人:Brian Dirking,合作夥伴行銷資深總監
AWS 主講人:Pratap Ramamurthy,合作夥伴解決方案架構師
Qubole
巨量資料技術既複雜又涉及耗時的手動流程。智慧地自動化巨量資料操作的組織可以降低成本、提高團隊生產力、更有效地擴展,並降低失敗風險。
在我們的網路研討會中,來自 TiVo (電視內容數位錄影平台創建者) 的代表將說明他們如何實作一個新的巨量資料與分析平台,該平台可根據變化的需求動態擴展。您將了解該解決方案如何使 TiVo 能夠使用 Amazon Elastic Cloud Compute (Amazon EC2) 和 Amazon EC2 Spot 執行個體輕鬆編排巨量資料叢集,這些執行個體從 Amazon Simple Storage Service (Amazon S3) 上的資料湖讀取資料,以及這如何降低支援其網路和廣告客戶用戶所需的開發成本與工作量。TiVo 將分享經驗教訓與最佳實踐,說明如何快速且經濟地從數百萬家庭中擷取、處理 TB 級的串流與批次收視資料,並使其可用於分析。
網路研討會標題:Tivo:如何利用 AWS 上的資料湖和 Qubole 擴展新產品
客戶主講人:Ashish Mrig,TiVo 巨量資料分析資深經理
Qubole 主講人:Harsh Jetly,解決方案架構師
AWS 主講人:Paul Sears,解決方案架構師
Talend
了解如何在 AWS 縮短開發時間和進行創新。在此網路研討會中,Beachbody (健身、減重及增肌居家運動影片銷售商) 將談論他們使用 Talend 移轉到 AWS 上資料湖架構的經驗。Beachbody 將描述他們如何建立一個開放的企業資料平台,讓員工能夠存取安全、治理完善的資料,並提高整個公司的 DevOps 效率。
加入我們的網路研討會,了解 Talend 和 AWS 如何協助 Beachbody 將各種非結構化與結構化資料來源移轉到資料湖、縮短開發與測試週期,並解決即時資料常見的複雜部署挑戰。
網路研討會標題:為企業架構開放式資料湖
Talend 主講人:Ashwin Viswanath,雲端產品行銷總監
客戶主講人:Eric Anderson,Beachbody 資料執行總監
AWS 主講人:Pratap Ramamurthy,解決方案架構師
Looker
現今的企業依賴巨量資料運作,而由這些資料產生的指標需要集中定義並全面可存取,才能帶來真正的效益。現今的解決方案是 Looker,一個現代化的資料平台,讓公司中的每個人都能尋找並探索他們做出決策所需的資料。Looker 為 Amazon Web Services (AWS) 等雲端平台而建置,並讓您能夠直接查詢資料湖等現代雲端資料庫。客戶使用 Looker 進行內部分析,以及向客戶、合作夥伴和供應商公開資料。