Portcast

Portcast 使用 Amazon SageMaker 擴展遠洋機器學習模型

2021 年

藉由機器學習 (ML) 提高供應鏈效率

海運是全球貿易的主要運輸方式,佔貿易量的 90%。儘管面對天氣干擾、海關延誤等其他因素,針對到達港口的貨物量進行預測和計劃的能力在很大程度上決定了供應鏈的效率。

新加坡新創公司 Portcast 透過其機器學習 (ML) 支援的平台提供預測性供應鏈軟體即服務 (SaaS),協助航運公司和製造商預測貨物到達港口的時間。Portcast 希望將客戶的手動工作量和集裝箱追蹤成本分別降低 80% 和 20%。該公司的專有 ML 模型能夠使用航運和集裝箱運輸的歷史規律和即時資料 (例如天氣狀況、港口交通和船舶位置) 提高供應鏈效率。

集裝箱的即時位置追蹤介面
kr_quotemark

在 Amazon SageMaker 的協助下,我們得以透過高效的雲端儲存和資料計算建置一個全球可擴展的預測性物流平台。」

Lingxiao Xia
Portcast 共同創始人兼技術長

隔離 ML 預測以實現獨立擴展

Portcast 使用一系列 Amazon Web Services (AWS) 服務來支援其底層基礎設施和大規模執行 ML 模型的能力。為儲存用於 ML 處理而收集的資料,該公司使用了 Amazon Relational Database Service (Amazon RDS) 和 Amazon Simple Storage Service (Amazon S3)。該公司還使用 Amazon Elasticsearch Service 實現搜尋日誌驅動分析。Portcast 聯合創始人兼技術長 Lingxiao Xia 表示:「AWS 上服務之間的互動非常順暢,這讓我們可以不斷嘗試不同的想法」。

截至 2019 年,Portcast 一直在使用 Amazon Elastic Compute Cloud (Amazon EC2) 裸機執行個體和自我託管叢集訓練與部署其 ML 模型。這方法一開始很有效,當時該公司一次只能追蹤幾百個集裝箱。然而,隨著公司的發展,每艘船運載的集裝箱數量經常多達兩萬個,這讓其 ML 預測的擴展變得複雜而昂貴。更為複雜的是,對於每個集裝箱,公司每天需要提供兩次最新到達預測。

如果採用裸機設定,Portcast 必須擴展其整個 ML 基礎設施,包括處理、預測和端點,這會產生非常高的記憶體需求。Portcast 需要隔離 ML 模型預測方面的工作,以實現獨立擴展;它使用 Amazon SageMaker 解決了這一挑戰。

使用無限的記憶體並行執行流程

在決定使用 Amazon SageMaker 之前,Portcast 已要求與 AWS 解決方案架構師進行一次實作培訓。Portcast 的資料團隊使用 Amazon SageMaker,透過將模型訓練與預測和處理分開,並從執行 ML 模型訓練的幾個實例開始,優化 ML 工作負載。現在,Portcast 使用 Amazon SageMaker 在其端到端 ML 週期中,從訓練、處理到預測的各個方面加速自動化。

Xia 表示:「透過將 ML 模型中的預測分出來作為一個單獨的服務,我們能夠個別擴展模型並降低記憶體需求。」

此前,Portcast 受限於它可以並行執行的流程數,因為每個模型都必須載入到記憶體中。Xia 補充道:「透過我們託管在 Amazon SageMaker 上的模型,我們可以在沒有記憶體限制的情況下,並行執行數百個流程。我們具備每天產生數百萬個預測的潛力。」Portcast 還使用 Amazon SageMaker 的多模型端點功能,透過在每個實例上託管多個模型來降低成本,在 ML 部署方面節省了至少 60% 的成本。

加速部署和自動化監控

目前,Portcast 每天監控數以萬計的集裝箱,以技術層面來說,這種規模在其以前的基礎設施上是不可能的。Xia 表示:「在 Amazon SageMaker 的協助下,我們得以透過高效的雲端儲存和資料計算建置一個全球可擴展的預測性物流平台。」

作為完全受管服務,Amazon SageMaker 會處理用於訓練和執行 ML 模型的底層基礎設施,因此 Portcast 只需確定初始設定即可。ML 模型可以自動擴展,而且在偵測到異常時,Amazon CloudWatch 會傳送警報。Portcast 的資料團隊有一個使用者介面,可提高處理作業及其狀態的可見性,而無需人工干預。這使得團隊每週可減少至少 2-3 個小時的基礎設施監控時間。

除節省時間外,Xia 還強調了減少環境切換帶來的價值。他解釋道:「如果資料科學家需要從分析模型轉為監控任務,環境切換成本要比花在任務上的成本高得多。」

改進資料科學/開發工作流程

Amazon SageMaker 的使用還降低了 Portcast 的資料科學和開發團隊之間的相依性。在資料團隊可以更新 ML 模型或添加新功能之前,開發人員不再需要設定基礎設施。在 Amazon SageMaker 內,資料科學家可以單獨建立任務所需的基礎設施。

一些精通 Amazon SageMaker 的資料科學家已成為公司內部的佼佼者。他們定期提供建議或發起專案,以協助解決瓶頸處理等常見挑戰。資料團隊還透過有針對性的會議和與 AWS 解決方案架構師探討如何在控制成本的同時擴展最佳化策略,積極豐富他們的 Amazon SageMaker 知識。

擴展規模以支援擴張

Portcast 聯合創始人兼執行長 Nidhi Gupta 認為,物流創新的最佳時機尚未到來。她說:「未來幾年只是我們行業的反曲點,我們預計未來將增長 10 到 20 倍。藉由 Amazon SageMaker,我們可以在不斷發展的同時,在同一平台上處理更多集裝箱。這可讓我們在最佳化資源的同時發掘更多商機,最終提高我們的利潤。」

進一步了解

如需進一步了解,請造訪 AWS 上的機器學習


關於 Portcast

Portcast 為物流公司和製造商提供預測可見性和需求預測技術。客戶可以將人工規劃減少 80%,並更準確地預測貨物需求和到達時間,從而控制成本。

AWS 的優勢

  • 再無記憶體限制的情況下,並行執行數百個 ML 流程
  • 每週至少節省 2-3 個小時的基礎設施監控時間
  • 2 年內追蹤的集裝箱數量從數百個擴展到數千個
  • ML 部署成本降低至少 60%
  • 減少開發人員和資料科學團隊之間的相依性
  • 營造自助服務文化,解決內部瓶頸

使用的 AWS 服務

Amazon SageMaker

Amazon SageMaker 透過整合專門為機器學習 (ML) 建置的一組廣泛的功能,協助資料科學家和開發人員快速準備、建置、訓練和部署高品質的機器學習 (ML) 模型。

進一步了解 »

Amazon CloudWatch

Amazon CloudWatch 是針對 DevOps 工程師、開發人員、網路可靠性工程師 (SRE) 和 IT 管理員建置的監控和可觀察性服務。

進一步了解 »

Amazon Relational Database Service (RDS)

Amazon Relational Database Service (Amazon RDS) 讓使用者能夠在雲端中輕鬆設定、操作和擴展關聯式資料庫。

進一步了解 »

Amazon Elasticsearch Service

Amazon Elasticsearch Service 是全受管服務,可讓您輕鬆大規模部署、保護及以經濟實惠的方式執行 Elasticsearch。

進一步了解 »


入門

各行各業、各種規模的公司每天都在使用 AWS 來轉型業務。聯絡我們的專家,立即開始使用 AWS 雲端服務。