張貼日期: Nov 26, 2019
Amazon Athena 現在可讓使用者針對儲存在關聯式、非關聯式、物件和自訂資料來源中的資料執行 SQL 查詢。透過聯合查詢,客戶可以提交單一 SQL 查詢,以掃描內部部署執行或在雲端託管的多個來源的資料。
而要跨應用程式對資料執行分析極為複雜,而且很費時間。分析所需的資料通常分佈在關聯式、金鑰值、文件、記憶體內、搜尋、圖形、物件、時間序列和分類帳資料儲存中。為了分析這些來源中的資料,分析師建置了複雜的通道來擷取、轉換和載入至資料倉儲中,以便可以查詢資料。若要從各種來源存取資料,需要學習新的程式設計語言和資料存取結構。Athena 中的聯合 SQL 查詢允許使用者從資料所在的任何位置就地查詢,從而消除了這種複雜性。分析師可以使用熟悉的 SQL 建構子,結合多個資料來源的資料進行快速分析,以及將結果儲存在 Amazon S3 以供後續使用。
Athena 使用 AWS Lambda 上執行的 Athena 資料來源連接器執行聯合查詢。AWS 擁有 Amazon DynamoDB、Apache HBase、Amazon Document DB、Amazon Redshift、AWS CloudWatch、AWS CloudWatch 指標和 JDBC 合規關聯式資料庫 (如根據 Apache 2.0 授權的 MySQL 和 PostgreSQL) 的開放原始碼資料來源連接器。客戶可以使用這些連接器在 Athena 的這些資料來源中執行聯合 SQL 查詢。此外,使用 Athena Query Federation SDK,開發人員可以建置任何資料來源的連接器,讓 Athena 能夠針對該資料來源執行 SQL 查詢。Athena Query Federation Connector 可將聯合查詢的優勢進一步擴展至 AWS 提供的連接器之外。由於連接器在 AWS Lambda 上執行,因此客戶不必管理基礎架構,或規劃擴展來適應峰值需求。