串流處理 – Amazon Managed Service for Apache Flink 功能

Amazon Managed Service for Apache Flink 可讓您更輕鬆地使用 Apache Flink 建置與執行即時串流處理應用程式。Amazon Managed Service for Apache Flink 可佈建和設定您的 Flink 叢集並協調 Flink 任務管理。它可設定監控和警示、提供自動擴展功能，且是專為高可用性 (包含可用區域容錯移轉) 而架構。這項服務可讓您存取 Apache Flink 的表達性 API，透過 Amazon Managed Service for Apache Flink Studio，僅需幾個步驟，您就能以互動方式查詢資料串流或啟動有狀態的應用程式。運用這項受管理服務，您就可以開始使用 Apache Flink，並快速部署和操作您的資料串流處理應用程式。

藉由 Amazon Managed Service for Apache Flink，您可以存取 Apache Flink 領先業界的各種功能，包含低延遲和高輸送量資料處理、僅處理一次，以及耐用的應用程式狀態。透過 Amazon Managed Service for Apache Flink，您可以部署安全、符合標準且高可用性的應用程式。Amazon Managed Service for Apache Flink 可輕鬆地跨多個可用區域複寫資料和工作負載，確保不間斷的效能和可靠性，而且無需支付額外容量費用。

使用 Amazon Managed Service for Apache Flink 可更輕鬆地開發應用程序，因為這項服務在 Java、Scala、Python 和 SQL 中支援 Flink 的靈活 API。Amazon Managed Service for Apache Flink 可以與數百個資料來源和目的地整合，例如 Amazon Managed Streaming for Apache Kafka (Amazon MSK)、Amazon Kinesis Data Streams、Amazon Kinesis Data Firehose、Amazon Simple Storage Service (Amazon S3)、Amazon DynamoDB、JDBC 連接器和自訂連接器。

使用 Apache Flink 的串流處理應用程式

開放原始碼

Amazon Managed Service for Apache Flink 包含開放原始碼程式庫，例如 Apache Flink、Apache Beam、Apache Zeppelin、AWS SDK 和 AWS 服務整合。Apache Flink 是可用來建置高可用性與精準串流應用程式的架構和引擎。Apache Beam 是一種統一模型，可用來定義在多個執行期引擎之間執行的串流和批次資料處理應用程式。AWS SDK 會以您偏好的語言提供 API，並且包含 AWS 程式庫、程式碼範例和文件，協助您消除為許多 AWS 服務編寫程式碼的複雜性。

靈活 API

Amazon Managed Service for Apache Flink 在 Java、Scala、Python 和 SQL 中支援 Flink 專為不同使用案例 (包含有狀態的事件處理、串流 ETL (擷取、轉換和載入) 和即時分析) 設計的靈活 API。透過預先建置的運算子和分析功能，您可以在數小時 (而不是數月) 內建置 Apache Flink 串流應用程式，而且程式庫是可擴充的，因此您可以針對各種使用案例執行即時處理。

AWS 服務整合

您可使用極少的程式碼來設定和整合資料來源或目的地。使用 Amazon Managed Service for Apache Flink 與下列 AWS 服務整合：

進階整合功能

除了 AWS 整合外，Amazon Managed Service for Apache Flink 程式庫還包含超過 40 個 Apache Flink 連接器，並且能夠建置自訂整合。您可透過數行程式碼，使用進階功能修改每個整合的行為模式。您還可以使用一系列 Apache Flink 原始類型來建置自訂整合，讓您從可透過網際網路存取的檔案、目錄、通訊端或其他來源進行讀取和寫入。

確切的一次性處理

使用 Amazon Managed Service for Apache Flink，您可以建置應用程式，其中已處理記錄恰好僅影響結果一次，故稱為「僅處理一次」。即使在應用程式中斷的情況下 (例如內部服務維護或使用者進行的應用程式更新)，該服務仍會確保將所有資料均處理完畢，且沒有重複的資料。

有狀態處理

該服務會在執行中的應用程式儲存體中，存放先前和處理中的運算或狀態。比較任意時段內的即時和過去結果，並在應用程式中斷期間實現快速復原。狀態會一律加密，並逐步儲存於執行中的應用程式儲存體中。

耐久應用程式備份

透過簡單的 API 呼叫，建立和刪除耐久應用程式備份。在中斷後立即從最新的備份還原應用程式，或者將應用程式還原為舊版。

機器學習 (ML) 整合

Amazon Managed Service for Apache Flink 支援機器學習 (ML) 演算法。您可以為分類、叢集、評估、特徵工程建議、迴歸和統計資料建立即時應用程式。

AWS Glue 結構描述登錄相檔相容性

Amazon Managed Service for Apache Flink 與 AWS Glue 結構描述登錄檔相容。結構描述登錄檔可協助您使用相容性檢查，管控做為來源或接收連接器連線至 Apache Kafka、Amazon MSK 或 Amazon Kinesis Data Streams 的 Amazon Managed Service for Apache Flink 工作負載上的結構描述，進而改善資料品質並防止非預期變更。

Amazon Kinesis Data Analytics Studio

串流檢查和視覺化

Kinesis Data Analytics Studio 支援內建視覺化的不及 1 秒查詢。您可執行臨機查詢，以迅速檢查資料串流，並於數秒內檢視結果。

簡便的建置並執行環境

Studio 筆記本為開發、偵錯程式碼及執行串流處理應用程式提供單一界面的開發經驗。

使用 SQL、Python 或 Scala 處理

Kinesis Data Analytics Studio 可支援在同一開發環境內使用 SQL、Python 及 Scala。語法強調顯示、驗證及內容相關建議，可在筆記本內引導您以內建支援的 Apache Flink 特定功能與資料互動。

快速、無伺服器串流處理應用程式開發

沒有要佈建、管理或擴展的伺服器。只需編寫程式碼並為您的應用程式取用的資源付費。在筆記本內輕鬆地部署程式碼至持續執行的串流處理應用程式，並處於自動擴展且耐久的狀態。

開放原始碼

Kinesis Data Analytics Studio 在 Apache Flink 上執行並製作生產中使用的 Apache Flink 應用程式，同時 Apache Zeppelin 筆記本能提供熟悉、易用的經驗，以自選的語言編撰串流應用程式。

與 AWS Glue Data Catalog 整合

AWS Glue Data Catalog 是持久性的中繼資料庫，可作為含有資料表定義的集中儲存器。您可以使用 AWS Glue Data Catalog 快速探索和搜尋多個 AWS 資料集。Kinesis Data Analytics Studio 與 AWS Glue Data Catalog 相容，您可用以為來源與目的地資料表定義結構描述。

Amazon Kinesis Data Analytics 入門

計算您的成本

造訪 Amazon Kinesis Data Analytics 定價頁面。

查看入門指南

透過 SQL 和 Apache Flink 的逐步指南了解如何使用 Amazon Kinesis Data Analytics。

開始建立串流應用程式

從 Amazon Kinesis Data Analytics 主控台建置您的第一個串流應用程式。

Amazon Managed Service for Apache Flink 功能

使用 Apache Flink 的串流處理應用程式

開放原始碼

靈活 API

AWS 服務整合

進階整合功能

確切的一次性處理

有狀態處理

耐久應用程式備份

機器學習 (ML) 整合

AWS Glue 結構描述登錄相檔相容性

Amazon Kinesis Data Analytics Studio

串流檢查和視覺化

簡便的建置並執行環境

使用 SQL、Python 或 Scala 處理

快速、無伺服器串流處理應用程式開發

開放原始碼

與 AWS Glue Data Catalog 整合

Amazon Kinesis Data Analytics 入門

結束對 Internet Explorer 的支援