Portcast 使用 Amazon SageMaker 扩展海上机器学习模型
2021
借助 Amazon SageMaker,我们可以为预测性物流构建可全球扩展的平台,并且该平台能够进行高效的云存储和数据计算。”
Lingxiao Xia
Portcast 联合创始人兼首席技术官
分隔机器学习预测以单独扩展
Portcast 使用各种 Amazon Web Services(AWS)来支持其底层基础设施和大规模运行机器学习模型的能力。为存储专为机器学习处理而收集的数据,该公司使用 Amazon Relational Database Service(Amazon RDS)和 Amazon Simple Storage Service(Amazon S3)。同时,还使用 Amazon Elasticsearch Service 进行搜索日志驱动分析。“AWS 服务间的互动可无缝进行,这使得我们能够持续地试验不同的想法,”Portcast 联合创始人兼首席技术官 Lingxiao Xia 说到。
2019 年之前,Portcast 一直在使用 Amazon Elastic Compute Cloud(Amazon EC2)裸机实例和自托管式集群来训练和部署其机器学习模型。起初,公司只需同时跟踪数百个集装箱,此方法的效果很好。然而,随着公司的壮大,一艘货船经常会搭载高达 2 万个集装箱,机器学习预测的扩展成为一项复杂且昂贵的工作。使复杂性加剧的是,该公司每天都需要对每个集装箱进行两次最新的到达预测。
由于裸机的设置,Portcast 必须将整个机器学习基础设施(包括处理、预测和端点)一同扩展,这使内存要求变得非常高。Portcast 需要分隔其机器学习模型的预测方向以进行单独扩展;通过使用 Amazon SageMaker,该公司解决了这一挑战。
通过无限内存并行多个流程
在决定使用 Amazon SageMaker 之前,Portcast 向 AWS 解决方案架构师们申请上手培训课程。Portcast 的数据团队使用 Amazon SageMaker 将模型训练从预测和处理中分离出来,从而优化机器学习工作负载,分离工作从一些进行机器学习模型训练的实例开始。现在,Portcast 使用 Amazon SageMaker 来加速端到端机器学习周期(从训练到处理再到预测)的自动化。
“通过将预测从机器学习模型中提取出来作为单独的服务,我们能够单独地扩展模型并降低内存要求,”Xia 说到。
此前,Portcast 受限于可并行的流程数,因为每个模型都必须加载至内存中。“将所有模型托管至 Amazon SageMaker 后,我们能够同时运行数百个流程,而没有内存限制。目前,我们一天能够生成数百万次预测,”Xia 补充到。Portcast 还利用 Amazon SageMaker 中的多模型端点功能,通过在每个实例上托管多个模型来降低成本,节省至少 60% 的机器学习部署工作。
加速部署和自动化监控
目前,Portcast 每天可监控数万个集装箱,对于之前的基础设施来说,此规模在技术上不可能实现的。“借助 Amazon SageMaker,我们可以为预测性物流构建可全球扩展的平台,并且该平台能够进行高效的云存储和数据计算,”Xia 说到。
作为全托管式服务,Amazon SageMaker 可处理训练和运行机器学习模型的底层基础设施,因此 Portcast 只需决定初始设置。机器学习模型将自动扩展,并且,当检测到异常时,Amazon CloudWatch 会发送警报。Portcast 的数据团队有一个用户界面,可在无需手动干预的情况下实现任务处理及其状态的高度可视化。此功能每周可为团队节省至少 2 到 3 小时的时间,在过去,这段时间被用于监控基础设施。
除省时之外,Xia 还强调了减少环境切换的价值。“如果我们的数据科学家需要从分析模型切换至监控任务,那么环境切换的成本是高于任务所花的时间的,”他解释到。
改进数据科学/开发工作流程
Amazon SageMaker 的引入还减少了 Portcast 数据科学团队与开发团队之间的依赖。在数据团队更新机器学习模型或添加新功能前,开发人员不再需要设置基础设施。数据科学家可以单独建立其 Amazon SageMaker 中任务所需的基础设施。
一些能够熟练使用 Amazon SageMaker 的数据科学家成为团队内部的翘楚。他们会定期建议或发起项目,以帮助团队解决处理方面的瓶颈等常见挑战。数据团队还会主动地参加针对性课程,并与 AWS 解决方案架构师讨论在扩展的同时控制成本的优化策略,从而深化其关于 Amazon SageMaker 的知识。
通过扩展机器学习模型支持公司的发展
Portcast 联合创始人兼首席执行官 Nidhi Gupta 认为物流创新的黄金时代尚未到来。“未来几年仅仅是我们行业的转折点,我们预计在未来的数月中,公司可以实现 10 到 20 倍的增长,”她说到。“随着公司的发展,我们能够凭借 Amazon SageMaker 在同一个平台上处理更多的集装箱。这使我们能够在优化资源的同时探索更多的商机,这可以从根本上提高我们的下限。”
了解更多
要了解更多信息,请访问 AWS 上的机器学习。
关于 Portcast
Portcast 为物流公司和制造商提供预测性可视化和需求预测技术。其客户可节省高达 80% 的手动计划工作,并更加准确地确定货物需求和到达时间,从而控制成本。
AWS 的优势
- 同时运行数百个机器学习流程,没有内存限制
- 每周节省至少 2 到 3 小时的基础设施监控时间
- 2 年内将集装箱跟踪数量从数百个扩展到数千个
- 降低至少 60% 的机器学习部署成本
- 减少开发人员团队与数据科学家团队之间的依赖
- 提倡自助文化,以解决内部瓶颈
使用的 AWS 服务
Amazon SageMaker
Amazon SageMaker 通过整合专门为机器学习 (ML) 构建的广泛功能集,帮助数据科学家和开发人员快速准备、构建、训练和部署高质量的机器学习模型。
Amazon CloudWatch
Amazon CloudWatch 是一种面向开发运营工程师、开发人员、站点可靠性工程师 (SRE) 和 IT 经理的监控和可观测性服务。
Amazon Relational Database Service(RDS)
Amazon Relational Database Service(Amazon RDS)让您能够在云中轻松设置、操作和扩展关系数据库。
Amazon Elasticsearch Service
Amazon Elasticsearch Service 是一项完全托管的服务,方便您大规模经济高效地部署、保护和运行 Elasticsearch。
开始使用
不同行业和规模的公司都在使用 AWS,将其日常业务运营进行转型。联系我们的专家,立即踏上您的 AWS Cloud 之旅。