AWS 上的分析

從所有資料獲得解答並提供給所有使用者的最快方式
可擴展的資料湖
成千上萬的客戶在 AWS 上執行他們的資料湖。在現今的環境中,資料湖的設定和管理涉及大量手動且耗時的任務。AWS Lake Formation 自動執行這些任務,這樣您就可在幾天 (而非幾個月) 內建置您的資料湖並提供保護。對於資料湖儲存體來說,Amazon S3 是建置資料湖的最佳場所,這是因為它具備無與倫比的 99.999999999% 耐久性和 99.99% 可用性;藉助物件層級稽核日誌和存取控制提供最佳安全性、合規和稽核功能;藉助 5 個儲存層提供最大的靈活性;藉助每月每 TB 低於 1 USD 的起步價提供最低的成本。
專門打造的分析服務
AWS 提供了最廣泛且最深入的專用分析服務組合,這些服務已針對您特有的分析使用案例進行了優化。這些服務均設計為同類最佳,這意味著您在使用它們時不必在效能、規模或成本上妥協。例如,相較於其他雲端資料倉儲,Amazon Redshift 的執行速度快 3 倍,並且至少便宜 50%。相較於標準 Apache Spark,Amazon EMR 上的 Spark 的執行速度快 1.7 倍,並且可以執行 PB 規模等級的分析,而成本不到傳統內部部署解決方案的一半。
無縫資料移動
隨著資料湖和專門打造的資料存放區中的資料不斷增長,您經常需要能夠輕鬆地將部分資料從一個資料存放區移動到另一個資料存放區。AWS 可讓您輕鬆地跨多個資料存放區和資料湖合併、移動和複寫資料。例如,AWS Glue 提供了全面的資料整合功能,藉助這些功能可以輕鬆發現、準備和合併資料以進行分析、機器學習和應用程式開發,而 Amazon Redshift 可以輕鬆查詢 S3 資料湖中的資料。相比於其他分析供應商,AWS 可讓您輕鬆地將資料大規模地移動到最需要的地方。
統一管控
現代分析架構中最重要的部分之一是客戶能夠授權、管理和稽核對資料的存取。此部分可能具備挑戰性,因為在組織的所有資料存放區中管理安全性、存取控制和稽核追蹤非常複雜、耗時且容易出錯。相比於其他分析供應商,藉助集中化存取控制和政策以及資料的欄層級篩選,AWS 可以為您提供管控功能,以集中管理跨資料湖和專門打造的資料存放區中所有資料的存取權限。
高效能且經濟實惠
AWS 致力於在所有分析服務中以最低的成本提供最佳效能,並且我們不斷創新以提升服務的性價比。除了面向分析服務的行業領先性價比之外,對於資料湖中儲存的資料,S3 智慧型分層還可以為客戶節省多達 70% 的儲存成本;此外,Amazon EC2 可以存取行業領先的 200 多種執行個體類型,提供高達 100Gbps 的網路頻寬,同時能夠在隨需、預留和 Spot 執行個體之間進行選擇。

AWS 分析服務

類別
使用案例
AWS 服務
分析
互動式分析

Amazon Athena

使用 SQL 查詢 S3 的資料

大數據處理

Amazon EMR

託管 Hadoop 框架。

資料倉儲

Amazon Redshift

快速、簡單、經濟實惠的資料倉儲。

即時分析

Amazon Kinesis

分析即時影片和資料串流。

營運分析

Amazon Elasticsearch Service

執行和擴展 Elasticsearch 叢集。

儀表板和視覺化

Amazon QuickSight

快速的商業分析服務。

視覺化資料準備

AWS Glue DataBrew

提高清理和標準化資料速度達 80%。

資料移動
即時資料移動

Amazon Managed Streaming for Apache Kafka (MSK)

全受管、高可用性和安全的 Apache Kafka 服務

Amazon Kinesis Video Streams

擷取、處理和存放影片串流以進行分析和機器學習。

Amazon Kinesis Data Firehose

準備即時資料串流並載入資料存放區和分析工具。

Amazon Kinesis Data Streams

大規模收集串流資料,以進行即時分析。

資料湖
物件儲存

Amazon S3

專為從任何位置存放和擷取任何數量資料所建立的物件儲存。

AWS Lake Formation

只要幾天的時間就能建立安全的資料湖

備份和存檔

Amazon S3 Glacier

雲端中的低成本存檔儲存。

AWS Backup

跨 AWS 服務的集中備份。

資料型錄

AWS Glue

準備和載入資料。

AWS Lake Formation

只要幾天的時間就能建立安全的資料湖

第三方資料

AWS Data Exchange

尋找及訂閱雲端中的第三方資料。

預測分析和機器學習
框架和界面

AWS Deep Learning AMIs

Amazon EC2 上的深度學習。

平台服務

Amazon SageMaker

大規模建立、訓練和部署機器學習模型。

AWS 分析服務

類別 使用案例 AWS 服務
分析 互動式分析 Amazon Athena
大數據處理 Amazon EMR
資料倉儲 Amazon Redshift
即時分析 Amazon Kinesis Data Analytics
營運分析 Amazon Elasticsearch Service
儀表板和視覺化 Amazon QuickSight
視覺化資料準備 Amazon Glue DataBrew
資料移動 即時資料移動 Amazon Managed Streaming for Apache Kafka (Amazon MSK) | Amazon Kinesis Data Streams | Amazon Kinesis Data Firehose | Amazon Kinesis Video Streams | AWS Glue
資料湖 物件儲存 Amazon S3 | AWS Lake Formation
備份和存檔 Amazon S3 Glacier | AWS Backup
資料型錄
AWS Glue | AWS Lake Formation
第三方資料 AWS Data Exchange
預測分析和機器學習 框架和界面 AWS Deep Learning AMIs
平台服務 Amazon SageMaker

使用案例

Page-Illo_Data-warehousing
資料倉儲

針對資料倉儲和資料湖中的結構化和非結構化資料,執行 SQL 和複雜的分析查詢,無須進行不必要的資料移動。

試用 Amazon Redshift »
Page-Illo_Big-data-processing
大數據處理

針對資料工程、資料科學開發和協作,以快速簡易的方式處理資料湖或內部部署的大量資料。

試用 Amazon EMR »
Page-Illo_Real-time-analytics
即時分析

收集、處理和分析串流資料,並將資料串流直接載入資料湖、資料存放區和分析服務中,以便您可以即時回應。

試用 Amazon MSK » 試用 Amazon Kinesis »
Page-Illo_Data-visualization
營運分析

針對應用程式監控、日誌分析和點擊流分析,以近乎即時的速度搜尋、瀏覽、篩選、彙總以及視覺化資料。

試用 Amazon Elasticsearch Service »

客戶

JD-Power_Logo_@1x

「我們在 Amazon S3 建立 120 TB 的資料湖,其中有 1500 種不同的結構,並廣泛使用 Glue、Redshift 和 Athena 等 AWS 分析服務。我們無法從眾多獨立的資料庫和倉儲取得這些洞見 – 我們需要一個 S3 規模的資料湖。」

– Bernardo Rodriguez
J.D. Power數位營運長

netflix
Chick-fil-A_Logo
3M Company_Logo
280x100_Georgia-Pacific_Logo
Pinterest_Customer-Reference_Logo
TMobile_Logo_@1x
Epic Games
Equinox.svg
Adobe_Customer-Reference_Logo
Pfizer
查看所有客戶 »

其他資源

AWS Data Lab

建立切實可行的交付內容,加速您的資料和分析現代化計劃。AWS Data Lab 是一項在您的建置者團隊與 AWS 技術資源之間開展的為期四天的深入互動活動。

進一步了解 »