AWS 大數據部落格是為了讓解決方案架構師、資料科學家及開發人員了解大數據的最佳實務,讓他們探索最符合其使用案例的受管 AWS 大數據服務,以及協助他們開始使用和更深入了解 AWS 大數據服務。部落格的目標是成為一個可讓所有人探索用於收集、儲存、處理、分析和視覺化任何規模資料的新方法的中心點。讀者可以找到包含程式碼範例的短篇教學、展示在 AWS 使用大數據有哪些獨特優點的案例研究、新功能宣告、合作夥伴和客戶製作的示範和教學,包含使用 AWS 大數據服務的秘訣和最佳實務。



Amazon 公用資料集計畫是為了託管所有人都可免費使用的相關資料集,以協助增加創新和先進的科學與研究。所以無論您是要探勘常用網路爬取開放網頁全集、比對一些基因體,或探索 NASA 的影像,AWS 都可提供啟動並執行所需的資料、服務和基礎設施。


DynamoDB 是一個全受管、高速的 NoSQL 資料庫服務。無論儲存和擷取任何數量的資料都非常簡單且經濟實惠,且可為任何層級的請求流量提供服務。執行可靠的輸送量和低於 10 毫秒的延遲,使其非常適合用於遊戲、廣告技術、行動以及許多其他應用程式。

Amazon Elastic MapReduce (Amazon EMR) 是一種 Web 服務,讓您能夠輕鬆快速且經濟實惠地處理大量資料。

Amazon EMR 使用稱為 Hadoop 的開放原始碼框架,可將您的資料分佈在可重新調整大小的 Amazon EC2 執行個體叢集中並進行處理。Amazon EMR 被廣泛用於各種應用中,包括日誌分析、Web 索引、資料倉儲、機器學習、財務分析、科學模擬和生物資訊學。客戶每年啟動數百萬個 Amazon EMR 叢集。

Amazon Kinesis 是一項全受管服務,用於即時處理大規模資料串流。Amazon Kinesis 每小時可從數十萬個來源收集和處理數百 TB 的資料,讓您輕鬆地撰寫處理即時資訊的應用程式,例如來自網站點擊流、行銷和財務資訊、生產製造檢測及社交媒體、營運記錄和計量資料等來源的資訊。

透過 Amazon Kinesis 應用程式,您可以建構即時儀表板、擷取例外狀況並產生提醒、推出建議並做出其他即時商業或營運決策。您也可以輕鬆地將資料傳送到其他各種服務,例如 Amazon Simple Storage Service (Amazon S3)、Amazon DynamoDB 或 Amazon Redshift。只要按幾下滑鼠和幾行程式碼,您就可以開始建構應用程式,在幾秒內回應資料流中任何規模的變更,而且只需為使用的資源付費。

Amazon S3 是針對網際網路的儲存服務,也是 AWS 上所有大數據架構的基本建構區塊。該服務旨在降低開發人員進行網路規模運算的難度。

Amazon S3 提供一個簡單的 Web 服務界面,可用於存放和擷取任意數量的資料,這些操作可從 Web 上的任何位置隨時執行。它讓所有開發人員能夠存取可高度擴展、可靠、安全、快速、低成本的相同基礎設施,Amazon 使用該基礎設施來執行自身的全球網站網路。此服務的目的是要盡可能增加擴展的好處,並將這些好處傳遞給開發人員。

Amazon Redshift 是快速、全受管的 PB 級資料倉儲服務,可讓您使用現有的商業智慧工具,以簡單且經濟實惠的方式有效率地分析所有資料。您可以用每小時 0.25 USD 的價格從小規模開始,無需簽訂長期合約或預付款,然後以每年每 TB 1,000 USD 的價格再擴展到 1 PB 或更多,這個費用比大多數其他資料倉儲解決方案成本的十分之一還要低。