- 分析›
- Amazon Data Firehose›
- 功能
Amazon Data Firehose 特徵
為什麼要使用 Amazon Data Firehose?
Amazon Data Firehose 是將串流資料載入資料存放區和分析工具最簡單的方式。Data Firehose 是一項完全受管的服務,可讓您輕鬆擷取、轉換並將大量串流資料載入 Amazon S3、Amazon Redshift、亞馬遜開放搜尋服務、雪花、Apache 冰山表、Amazon S3 表格、通用 HTTP 端點以及 Datadog、New Relic、MongoDB 和 Splunk 等服務供應商,實現即時分析和洞察。
Firehose 串流
全部開啟-
Firehose 串流是 Firehose 的基礎實體。您透過建立 Firehose 串流,然後將資料傳入 Firehose 串流來使用 Firehose。
主要特色
全部開啟您只需在 AWS 管理主控台中點擊幾下,即可啟動 Amazon 資料消防管並建立交付串流,將資料載入 Amazon S3、亞馬遜 Redshift、亞馬遜開放搜尋服務、雪花、Apache 冰山表格、亞馬遜 S3 表格、HTTP 端點、資料記錄檔、新遺跡、MongoDB 或 Splunk。a您可以呼叫 Firehose API 或執行我們在資料來源提供的 Linux 代理器,將資料傳送到交付串流。Data Firehose 接著會持續將資料載入指定目的地。
-
啟動後,您的 Firehose 串流會自動向上擴展每秒處理的 GB 數或提高輸入資料速率,並在限制內維持您為串流指定的資料延遲等級。不需要進行干預或維護工作。
-
您可以指定批次大小或批次間隔,以控制資料上傳至目的地的速度。例如,您可在零秒到 15 分鐘之間設定批次間隔時間。此外,還可以指定是否要壓縮資料。服務支援常見的壓縮演算法,包含 GZip、Hadoop-Compatible Snappy、Zip 和 Snappy。上傳前對資料進行批次處理和壓縮,可讓您控制目的地收到新資料的速度。
-
Firehose 支援 Apache Parquet 和 Apache ORC 等單欄資料格式,已透過 Amazon Athena、Amazon Redshift Spectrum、Amazon EMR 等服務和其他 Hadoop 工具進行優化,可提供符合經濟效益的儲存和分析。Firehose 可將傳入資料的格式從 JSON 轉換成 Parquet 或 ORC 格式,然後將該資料存放到 Amazon S3,讓您節省儲存和分析的成本。
-
使用靜態或動態定義的金鑰,例如 “customer_id” 或 “transaction_id”,在交付到 S3 之前,動態分割您的串流資料。 Firehose 依這些金鑰將資料分組,並交付到金鑰獨有的 S3 前綴中,讓您更容易使用 Athena、EMR 和 Redshift Spectrum,在 S3 中執行高效能、符合成本效益的分析。了解更多
-
您可以設定 Amazon Data Firehose 先準備好串流資料,然後再將它載入資料存放區。只需從 AWS 管理主控台中的 Amazon Data Firehose 串流組態標籤選取一個 AWS Lambda 函數。 然後 Amazon Data Firehose 會自動將該函數套用到每筆輸入資料記錄,並將轉換過的資料載入目標。 Amazon Data Firehose 提供預先建立的 Lambda 藍圖,這些藍圖可將 Apache 日誌和系統日誌這類常見的資料來源轉換為 JSON 和 CSV 格式。您可以直接使用這些預先建立的藍圖,不需進行任何變更,或是進一步自訂它們,甚至是編寫您自己的自訂函數。您也可以設定 Amazon Data Firehose 自動重試失敗的任務,以及備份原始串流資料。 了解更多
Firehose 從 20 多個資料來源輕鬆讀取資料,包括亞馬遜 MSK 和 MSK 無伺服器叢集、亞馬遜 Kinesis 資料串流、亞馬遜 CloudWatch 記錄檔、亞馬遜 SNS、AWS 物聯網核心等。亞馬遜資料消防管目前支援亞馬遜 S3、亞馬遜 Redshift、亞馬遜開放搜尋服務、雪花、Apache 冰山表、亞馬遜 S3 表格、HTTP 端點、資料記錄檔、新遺物、MongoDB 和 Splunk 目的地。您可以指定目的地為 Amazon S3 儲存貯體、Amazon Redshift 表、Amazon OpenSearch Service 網域、一般 HTTP 端點或是要載入資料的服務供應商。
-
Amazon Data Firehose 提供的選項可讓您在將資料上傳到目的地之後自動加密資料。您可以在設定 Firehose 串流時,指定 AWS Key Management System (KMS) 加密金鑰。
-
Amazon Data Firehose 透過主控台和 Amazon CloudWatch 公開多個指標,其中包含提交的資料量、上傳到目的地的資料量、來源到目的地的時間、Firehose 串流限制、限制的記錄數及上傳成功率。
-
使用 Amazon Data Firehose 時,您只需就透過此服務傳輸的資料量付費,以及資料格式轉換費 (如適用)。另外,您需要支付 Amazon VPC 交付和資料傳輸費用 (如適用)。沒有最低費用,也無須前期承諾。您不需要指派人員操作、擴展和維護基礎設施,或自訂應用程式來擷取並載入串流資料。