大部分競爭資料倉儲解決方案每年花費多達一百萬 USD。相反地,Amazon Redshift 讓我們只花費 100,000 USD 就能涵蓋所有功能,代表總成本大約節省了 90%。 
Joel Cumming 資料主管

加拿大滑鐵盧大學一群優秀的學生在 2009 年創立了 Kik Interactive。現在有超過 2 億 7500 萬訂閱者 (大多數在美國) 使用該公司的簡訊服務 Kik Messenger。Kik Messenger 除了免費提供各種文字、圖片和影片的簡訊功能,還有一個可搜尋和存取 Web 內容的整合瀏覽器。Kik 也提供開發人員工具,讓組織能優化自己的 Web 內容,然後在 Kik 的平台上將內容散發給訂閱者。

為了留住既有的訂閱者並維持成長,Kik 必須確保簡訊服務迅速且回應力佳,還要持續供訂閱者使用。Kik DevOps 團隊主管 Chris Fairles 表示:「訂閱者信賴我們每次都能即時傳送他們的訊息,這也是我們極為重視的責任。為了讓服務盡善盡美,我們投資足夠可靠、安全、彈性的技術,以符合訂閱者隨時變動的需求。」

另一項挑戰是,Kik 必須傾聽訂閱者的心聲,確保最新的產品改進功能符合他們的需求。「我們擁有許多與客戶有關以及客戶如何使用服務的相關資料,但是經常被日誌檔或公司其他系統鎖住而無法查看。」Fairles 表示。「為了將這些資料轉變成實際的商業洞見,並確保所有開發決策都是以有力的證據為基礎,我們大量投資在最新的大數據技術和科技。」

Kik 為了提供最佳的訂閱者體驗,使用內部伺服器結合 Amazon Web Services (AWS) 雲端託管的基礎設施。Fairles 說:「我們使用 AWS 為使用者提供各種功能,從設定個人檔案圖片、傳送圖片簡訊,到傳送影片簡訊和管理帳戶等等。」

Kik 的 AWS 架構融入了 Amazon Elastic Compute Cloud (Amazon EC2)、Amazon Simple Storage Service (Amazon S3) 和 Amazon Virtual Private Cloud (Amazon VPC),並隨需使用 Amazon CloudFormation 來佈建和部署雲端基礎設施。「使用 AWS CloudFormation,我們採用了一種稱為微型服務的架構,我們所有的 AWS 基礎設施都定義為程式碼。」Fairles 表示。「不久之後還會採用 Amazon CodeDeploy,這樣就可以輕鬆快速地擴充標準化 IT 堆疊,幾乎不需要任何手動操作。」

有了 AWS,Kik 也能為訂閱者提供迅速且回應力佳的服務體驗。「我們使用 Amazon Direct Connect 加快內部伺服器陣列與 AWS 雲端之間的資料交換速度,能將延遲和抖動情形降到最低。」Fairles 說。「我們也使用 Amazon CloudFrontAmazon Route 53 將內容傳送到最接近訂閱者的節點,無論使用者在哪裡,我們的應用程式都能非常迅速靈敏。」

Kik 還利用微型服務架構在 AWS 上建立複雜的資料分析平台,提供全新且具有附加價值的商業洞見,並優化訂閱者的體驗。這都是倚賴 Amazon EC2、Amazon S3 和 Amazon VPC,加上 Amazon Redshift 提供核心的資料倉儲功能。

分析活動的來源資料來自之前存放在 Amazon S3 儲存貯體中的數百 TB 日誌檔資料。將日誌檔載入 Amazon Redshift 做更進一步的壓縮之前,會先使用 Amazon Elastic Map Reduce (Amazon EMR) 和 Hadoop Pig 指令碼來摘要和處理日誌檔。「我們一開始有 500 TB 的資料量,但現在只需管理 50 TB,讓我們的工作變得容易許多。」

Kik 的 AWS 基礎設施納入 Auto Scaling,讓公司可以用更經濟實惠的方式提供簡訊服務和其他內容,並且只需要依實際使用的運算與儲存資源付費。「我們的 AWS 架構可在流量尖峰時段自動擴展,然後在需求降低時再度縮減。」Fairles 說。「這表示我們只需要依據使用的運算與儲存資源付費,比起其他方式,這對營運非常有利。」

Kik 也能透過 AWS 優化訂閱者的服務可用性。「我們 AWS 架構的每個元件都完全冗餘,表示即使發生重大的技術問題,我們也能讓服務維持運作。」Fairles 說。「我們也在 AWS 中使用多個可用區域,即使整個 AWS 資料中心都無法運作,訂閱者也能夠持續使用我們的應用程式。」 

利用 Amazon Redshift,Kik Interactive 能夠從客戶和營運資料獲得有價值的洞見。Kik 資料主管 Joel Cumming 說:「我們可以知道不同類型的使用者如何運用我們的服務,並且找出他們的需求和偏好。然後可以使用這些洞見告知新的開發專案、處理服務問題、尋找新的目標市場、提供個人化體驗,及減少客戶流失。」

使用 Amazon Redshift 獲得這類洞見不需花費大量金錢,可免除內部硬體、軟體和支援的需求。「考慮購買成本及後續的維護和支援,大多數競爭資料倉儲解決方案每年大約需花費一百萬 USD。」Cumming 表示。「相反地,Amazon Redshift 讓我們只花費 100,000 USD 就能涵蓋所有功能,總成本大約節省了 90%。」

最近 Redshift 硬體進行了升級,Kik 不需花費任何成本,資料倉儲的效能就提升了 30%。「AWS 一直持續升級它們的平台,讓我們能夠比以往更迅速洞察更多商業先機。」Cumming 表示。「因此,我們可以使用更少的資源,從更多來源收集更多資料,以新的方式深入了解客戶的需求。」

Kik 最近部署了 AWS Lambda,Cumming 將此視為公司資料分析的「下一個發展領域」。「我們非常興奮,」他說。「我們不需要自己動手,AWS Lambda 會自動佈建執行資料科學應用程式所需的基礎設施。我們不需花時間維護伺服器,而可以專注在洞察商業先機以及改善使用者體驗這些強項上。」

除了 AWS Lambda,Kik 也使用 Amazon API GatewayAmazon DynamoDB,兩者能讓整個公司的內部服務即時存取所需的資料。「API Gateway 可以讓我們非常迅速地對複雜的統計模型進行簡單處理,以及在產品內進行個人化設定。」Cumming 說。「我們在 DynamoDB、Lambda 和 API Gateway 非常迅速地建置了第一個重複的內部資料 API,現在 Kik 內的服務不僅可以進行個人化設定,還能以過去做不到的方式進行擴展。」

若要進一步了解 AWS 如何協助您降低資料管理成本,請瀏覽我們的大數據詳細資訊頁面