Portcast

Portcast 使用 Amazon SageMaker 扩展海上机器学习模型

2021

通过机器学习(ML)提升供应链效率

海上货运是全球贸易的主要运输方式,占贸易量的 90%。尽管存在天气中断、海关延误和其他因素,预测和计划货物到达港口时间的能力仍在很大程度上决定了供应链的效率。

新加坡初创企业 Portcast 通过其机器学习(ML)支持的平台提供一项预测性供应链软件即服务(SaaS),帮助货运公司和制造商预测货物到达港口的时间。Portcast 希望将客户的手动工作量和集装箱跟踪成本分别降低 80% 和 20%。该公司的专利机器学习模型使用货运和集装箱移动的历史模式和天气条件、港口交通和货船位置等实时数据来提高供应链效率。

集装箱实时位置跟踪界面
kr_quotemark

借助 Amazon SageMaker,我们可以为预测性物流构建可全球扩展的平台,并且该平台能够进行高效的云存储和数据计算。”

Lingxiao Xia
Portcast 联合创始人兼首席技术官

分隔机器学习预测以单独扩展

Portcast 使用各种 Amazon Web Services(AWS)来支持其底层基础设施和大规模运行机器学习模型的能力。为存储专为机器学习处理而收集的数据,该公司使用 Amazon Relational Database Service(Amazon RDS)和 Amazon Simple Storage Service(Amazon S3)。同时,还使用 Amazon Elasticsearch Service 进行搜索日志驱动分析。“AWS 服务间的互动可无缝进行,这使得我们能够持续地试验不同的想法,”Portcast 联合创始人兼首席技术官 Lingxiao Xia 说到。

2019 年之前,Portcast 一直在使用 Amazon Elastic Compute Cloud(Amazon EC2)裸机实例和自托管式集群来训练和部署其机器学习模型。起初,公司只需同时跟踪数百个集装箱,此方法的效果很好。然而,随着公司的壮大,一艘货船经常会搭载高达 2 万个集装箱,机器学习预测的扩展成为一项复杂且昂贵的工作。使复杂性加剧的是,该公司每天都需要对每个集装箱进行两次最新的到达预测。

由于裸机的设置,Portcast 必须将整个机器学习基础设施(包括处理、预测和端点)一同扩展,这使内存要求变得非常高。Portcast 需要分隔其机器学习模型的预测方向以进行单独扩展;通过使用 Amazon SageMaker,该公司解决了这一挑战。

通过无限内存并行多个流程

在决定使用 Amazon SageMaker 之前,Portcast 向 AWS 解决方案架构师们申请上手培训课程。Portcast 的数据团队使用 Amazon SageMaker 将模型训练从预测和处理中分离出来,从而优化机器学习工作负载,分离工作从一些进行机器学习模型训练的实例开始。现在,Portcast 使用 Amazon SageMaker 来加速端到端机器学习周期(从训练到处理再到预测)的自动化。

“通过将预测从机器学习模型中提取出来作为单独的服务,我们能够单独地扩展模型并降低内存要求,”Xia 说到。

此前,Portcast 受限于可并行的流程数,因为每个模型都必须加载至内存中。“将所有模型托管至 Amazon SageMaker 后,我们能够同时运行数百个流程,而没有内存限制。目前,我们一天能够生成数百万次预测,”Xia 补充到。Portcast 还利用 Amazon SageMaker 中的多模型端点功能,通过在每个实例上托管多个模型来降低成本,节省至少 60% 的机器学习部署工作。

加速部署和自动化监控

目前,Portcast 每天可监控数万个集装箱,对于之前的基础设施来说,此规模在技术上不可能实现的。“借助 Amazon SageMaker,我们可以为预测性物流构建可全球扩展的平台,并且该平台能够进行高效的云存储和数据计算,”Xia 说到。

作为全托管式服务,Amazon SageMaker 可处理训练和运行机器学习模型的底层基础设施,因此 Portcast 只需决定初始设置。机器学习模型将自动扩展,并且,当检测到异常时,Amazon CloudWatch 会发送警报。Portcast 的数据团队有一个用户界面,可在无需手动干预的情况下实现任务处理及其状态的高度可视化。此功能每周可为团队节省至少 2 到 3 小时的时间,在过去,这段时间被用于监控基础设施。

除省时之外,Xia 还强调了减少环境切换的价值。“如果我们的数据科学家需要从分析模型切换至监控任务,那么环境切换的成本是高于任务所花的时间的,”他解释到。

改进数据科学/开发工作流程

Amazon SageMaker 的引入还减少了 Portcast 数据科学团队与开发团队之间的依赖。在数据团队更新机器学习模型或添加新功能前,开发人员不再需要设置基础设施。数据科学家可以单独建立其 Amazon SageMaker 中任务所需的基础设施。

一些能够熟练使用 Amazon SageMaker 的数据科学家成为团队内部的翘楚。他们会定期建议或发起项目,以帮助团队解决处理方面的瓶颈等常见挑战。数据团队还会主动地参加针对性课程,并与 AWS 解决方案架构师讨论在扩展的同时控制成本的优化策略,从而深化其关于 Amazon SageMaker 的知识。

通过扩展机器学习模型支持公司的发展

Portcast 联合创始人兼首席执行官 Nidhi Gupta 认为物流创新的黄金时代尚未到来。“未来几年仅仅是我们行业的转折点,我们预计在未来的数月中,公司可以实现 10 到 20 倍的增长,”她说到。“随着公司的发展,我们能够凭借 Amazon SageMaker 在同一个平台上处理更多的集装箱。这使我们能够在优化资源的同时探索更多的商机,这可以从根本上提高我们的下限。”

了解更多

要了解更多信息,请访问 AWS 上的机器学习


关于 Portcast

Portcast 为物流公司和制造商提供预测性可视化和需求预测技术。其客户可节省高达 80% 的手动计划工作,并更加准确地确定货物需求和到达时间,从而控制成本。

AWS 的优势

  • 同时运行数百个机器学习流程,没有内存限制
  • 每周节省至少 2 到 3 小时的基础设施监控时间
  • 2 年内将集装箱跟踪数量从数百个扩展到数千个
  • 降低至少 60% 的机器学习部署成本
  • 减少开发人员团队与数据科学家团队之间的依赖
  • 提倡自助文化,以解决内部瓶颈

使用的 AWS 服务

Amazon SageMaker

Amazon SageMaker 通过整合专门为机器学习 (ML) 构建的广泛功能集,帮助数据科学家和开发人员快速准备、构建、训练和部署高质量的机器学习模型。

了解更多 »

Amazon CloudWatch

Amazon CloudWatch 是一种面向开发运营工程师、开发人员、站点可靠性工程师 (SRE) 和 IT 经理的监控和可观测性服务。

了解更多 »

Amazon Relational Database Service(RDS)

Amazon Relational Database Service(Amazon RDS)让您能够在云中轻松设置、操作和扩展关系数据库。

了解更多 »

Amazon Elasticsearch Service

Amazon Elasticsearch Service 是一项完全托管的服务,方便您大规模经济高效地部署、保护和运行 Elasticsearch。

了解更多 »


开始使用

不同行业和规模的公司都在使用 AWS,将其日常业务运营进行转型。联系我们的专家,立即踏上您的 AWS Cloud 之旅。