開始使用 Amazon Kinesis Data Streams
開始使用
Amazon Kinesis Data Streams 是已針對串流資料最佳化的可大規模擴展、高耐用性的資料擷取和處理服務。您可以設定數十萬個資料生產程式,以持續將資料放入 Kinesis 資料串流。您的 Amazon Kinesis 應用程式將在毫秒內存取資料,而這些應用程式將按產生順序接收資料記錄。
Amazon Kinesis Data Streams 與多個 AWS 服務整合,包括 Amazon Kinesis Data Firehose,可用於近乎即時的轉型,並將串流資料交付到 Amazon S3 這類 AWS 資料湖;Amazon Managed Service for Apache Flink 用於受管串流處理;AWS Lambda 用於事件或記錄處理;AWS PrivateLink 用於私有連線;Amazon Cloudwatch 用於指標和日誌處理;以及 AWS KMS 用於伺服器端加密。
Amazon Kinesis Data Streams 用作大數據解決方案的閘道。來自各種來源的資料會放入 Amazon Kinesis 串流中,然後不同的 Amazon Kinesis 應用程式會使用這些串流中的資料。在這個範例中,有一個應用程式 (黃色) 正在對串流資料執行即時儀表板。另一個應用程式 (紅色) 則執行簡易的彙總並將處理過的資料發送到 Amazon S3。S3 內的資料會經過進一步處理,並存放於 Amazon Redshift 以進行複雜的分析。第三個應用程式 (綠色) 會將原始資料傳送至 Amazon S3,這些資料接著會封存至 Amazon Glacier 以降低長期儲存的成本。要注意的是,這 3 個資料處理管道是同時且平行地在進行。
開始使用 Amazon Kinesis Data Streams
影片
使用 Kinesis Data Streams
註冊 Amazon Web Services 後,就可以透過以下步驟開始使用 Amazon Kinesis Data Streams:
- 透過亞馬遜 Kinesis 管理主控台或亞馬遜 Kinesis CreateStream API 建立亞馬遜 Kinesis 資料串流。
- 設定資料生產程式,以持續將資料放入 Amazon Kinesis 資料串流。
- 建立您的亞馬遜 Kinesis 應用程式,以讀取和處理 Amazon Kinesis 資料串流中的資料。
主要概念
全部開啟碎片是 Amazon Kinesis 資料串流的基本輸送量單位。
- 碎片是只能附加但不能修改的日誌和串流功能單位。碎片包含依照抵達時間排序的記錄。
- 一個碎片每秒可擷取最多 1000 個資料記錄,或是 1 MB/秒。新增更多碎片可提升擷取功能。
- 使用 AWS 主控台、 UpdateHardCount API 、透過 AWS Lambda 觸發自動擴展,或使用自動調整公用程式,隨資料輸送量變更,動態從串流中新增或移除碎片。
- 取用程式使用增強型散發時,一個碎片針對每個註冊使用增強型散發的資料取用程式提供 1 MB/秒的資料輸入和 2 MB/秒的資料輸出。
- 取用程式不使用增強型散發時,一個碎片可提供 1 MB/秒的輸入和 2 MB/秒的資料輸出,而且這個輸出會與任何未使用增強型散發的取用程式共用。
- 建立串流時要指定所需的碎片數量,這個數量可以隨時更改。例如,您可以建立具有兩個碎片的串流。如果有 5 個資料取用程式使用增強型散發,這個串流可提供最多 20 MB/秒的總資料輸出 (2 個碎片 x 2 MB/秒 x 5 個資料取用程式)。資料取用程式不使用增強型散發時,此串流具有 2 MB/秒資料輸入和 4 MB/秒資料輸出的輸送量。在所有情況下,這個串流都能允許每秒最多 2000 個 PUT 記錄,或是 2 MB/秒的輸入,以先達到的限制為準。
- 您可以監控 Amazon Kinesis Data Streams 中碎片層級的指標。
將資料放入串流
全部開啟執行應用程式或建立自己的應用程式
全部開啟管理串流
全部開啟教學
全部開啟本教學將逐步介紹如何建立 Amazon Kinesis 資料串流、將模擬股票交易資料發送至串流,以及撰寫可處理來自資料串流之資料的應用程式。
特色簡報
全部開啟想要提升 AWS 大數據 Web 服務的知識,並在雲端啟動您的第一個大數據應用程式? 我們引導您將大數據程序簡化成包含下列階段的資料匯流排:導入、存放、處理及視覺化。您可以使用 Amazon Athena、Amazon Kinesis、Amazon DynamoDB 和 Amazon S3 等 AWS Managed Services 建立大數據應用程式。整個過程中,我們會回顧大數據應用程式的架構設計模式,並讓您存取可在家操作的實驗室,方便您自行重建和自訂應用程式。您應自備筆記型電腦,並對 AWS 服務有一定程度的熟悉,才能在這次會議中獲得最多的收穫。
近年來,連線裝置和即時資料來源的數量已呈爆炸性的成長。正因為如此,資料不斷持續產生,而生產速度正在加快。企業不能再等待數小時或數天的時間之後,才能使用這些資料。為了獲得最有價值的洞見,他們必須立即使用這些資料,以便能夠對新資訊做出快速反應。在這個研討會中,您可了解如何利用串流資料來源,以近乎即時的速度進行分析和做出反應。您會看到真實世界串流資料場景中的一些需求,而且您要使用 Amazon Kinesis、AWS Lambda 和 Amazon SNS 等服務建立一個可順利滿足這些需求的解決方案。
加快從資料獲得可行的洞見,對於使用批次資料分析工具探索串流分析優點的所有企業和客戶而言十分重要。了解最佳實務,將您的架構從資料倉庫和資料庫擴展到即時解決方案。了解如何使用 Amazon Kinesis 獲得即時資料洞見,並將其與 Amazon Aurora、Amazon RDS、Amazon Redshift 和 Amazon S3 整合在一起。Amazon Flex 團隊描述他們如何在 Amazon 送貨司機的 Amazon Flex 行動應用程式中使用串流分析,每個月都能按時送達數百萬件包裹。他們討論一種可以從批次處理系統轉移到即時系統的架構,克服了將現有批次資料遷移到串流資料的挑戰,以及如何從即時分析中獲益。