問:什麼是 Amazon DataZone?
Amazon DataZone 是一項資料管理服務,可讓客戶更快、更輕鬆記載、探索、共用和管控儲存在 AWS、內部部署與第三方來源之間的資料。有了 Amazon DataZone,工程師、資料科學家、產品經理、分析師和商業使用者都可以快速存取整個組織的資料,以便他們可以探索、使用與協作獲得資料驅動的洞察。監督組織資料資產的管理員和資料擁有者可以輕鬆管理與管控對資料的存取權。Amazon DataZone 提供內建工作流程,供資料消費者請求存取資料,並讓資料擁有者核准存取權。
問:使用者如何與 Amazon DataZone 互動?
Amazon DataZone 為資料人員人員提供統一的資料管理入口網站,以便記載、探索、存取、分析和管控整個組織的資料。他們如此一來就能更輕鬆地與資料工程師和 IT 管理員協作,以便從資料中獲取洞察。Amazon DataZone 可協助使用者透過 Web 型應用程式使用 Amazon Redshift 查詢編輯器和 Amazon Athena 業務資料型錄中的資料資產。如此一來,偏好非主控台體驗的使用者,就無需登入 AWS 管理主控台。為了以程式設計方式建立、設定或與現有流程整合,Amazon DataZone 已發佈 API,隨附說明使用方式的指南。
問:我可以使用 Amazon DataZone 管理哪些類型的資產?
您可以使用 Amazon DataZone 來管理由 AWS Lake Formation 管理的 AWS Glue 資料表以及 Amazon Redshift 資料表中的資料資產。除此之外,透過 AWS Glue 連接器以及其與 Amazon AppFlow 的整合,可以記載來自各種來源的資產,以提升整個組織的可見度。在正式上市的情況下,您可以設定 Amazon DataZone 來記載自訂資產,您可以在其中靈活地定義何謂資產。
問:什麼是 Amazon DataZone 專案,以及專案的運作模式為何?
Amazon DataZone 專案是以商業使用案例為基礎的使用者、資料資產和分析工具的群組。群組提供了一個協作空間,專案使用者可以在其中協作並交換資料和成品。專案得到保護,從而只有明確新增至專案中的使用者才能存取其中的資料和工具。
部署完畢後,專案會根據專案選取的功能 (例如資料湖) 建立 AWS Identity and Access Management (IAM) 角色,這些角色專門為使用者提供完成工作所需的存取權限。專案還可以在相同帳戶內提供工作隔離功能,以及安全性邊界(安全群組和 IAM 角色)。 若要在專案中處理資料,您可以先建立環境。環境會根據提供使用者完成工作所需的存取權限之工具和功能 (例如資料湖) 建立 IAM 角色。
問:Amazon DataZone 是否支援商業詞彙表?
是,Amazon DataZone 業務資料型錄支援商業詞彙表。商業詞彙表就像組織的字典,詞彙表中列出了商業術語與定義,進而確保在發現和分析資料時,整個組織使用相同的定義。除此之外,業務資料型錄還提供中繼資料表,以便自訂、授權或定義資產的額外中繼資料,以便資料人員在使用資產進行分析之前,先行學習和理解資產。
問:Amazon DataZone 與 Lake Formation 有何關聯?
Amazon DataZone 使用 Lake Formation 建構模組摘要資料生產者和消費者之間共享資料的過程。Amazon DataZone 會根據資料發布者所套用的政策,自動履行對基礎 (由 Amazon DataZone 管理) 資產的資料存取。無需管理員或資料移動即可履行。
問:我能以程式設計方式與 Amazon DataZone 互動嗎?
是,我們將新增對 API、AWS CloudFormation、AWS Command Line Interface (AWS CLI) 和 AWS Cloud Development Kit (AWS CDK) 的支援。