优势
5
分钟或更短时间即可启动 GPU 实例300
名开发人员和工程师注册加入概览
Torc Robotics(Torc)希望为其分散的员工队伍提供远程开发辅助。该公司开发自动驾驶汽车软件和技术,旨在于 2027 年前实现自动驾驶半挂式卡车的商业化。为了支持这些工作,Torc 需要一个安全、强大的虚拟桌面基础架构(VDI)解决方案,以便工程师能够运行基于 GPU 和 CPU 的大型工作负载。
Torc 已经使用 Amazon Web Services(AWS)处理其许多工作负载,例如,该公司利用 Amazon DCV 构建了一个 VDI 解决方案,从而可交付高性能远程桌面和应用程序流媒体。现在,Torc 工程师可以在几分钟内安全、高度可用地访问所需的计算资源,并且该公司可以继续朝着其目标努力前进,即利用自动驾驶技术提高高速公路安全性。
关于 Torc Robotics
Torc Robotics 成立于 2005 年,是 Daimler Truck 的独立子公司,致力于将自动驾驶卡车商业化,为货运行业提供更安全、更持久的长途运输解决方案。
机会 | 利用 Amazon DCV 为 Torc 创建 VDI Ranch
Torc 成立于 2005 年并于 2019 年成为 Daimler Truck 的独立子公司,致力于为枢纽到枢纽运输提供自动驾驶卡车运输软件产品,其愿景是为车队客户提供市场上最安全、最可靠且最经济高效的解决方案。Torc 高级工程经理 Jason Fox 表示:“安全性是 Torc 的至高要务。卡车运输行业正面临驾驶员短缺和效率低下等问题,而公路上涉及卡车的交通事故也很多。因此有机会提高道路安全性和货物运输效率,而 Torc 在此的作用是开发自动驾驶半挂式卡车。” 2024 年,Torc 完成了其首款无需驾驶员的产品版本在生产用硬件和软件方面的验证。该公司目前正在进行公路测试,出发地为其位于达拉斯-沃斯堡地区的自动驾驶枢纽。
Torc 的工程师和开发人员分散在多个地点开展工作,因此该公司力求能在受管控的标准化环境中支持远程开发,从而保护其知识产权。Torc 还希望为支持其自动驾驶软件的机器学习研究和训练提供灵活的 GPU 资源访问权限。同时,Torc 并不想创建一个集中式环境,因为这样会产生高昂的维护开销或造成单点故障。Fox 表示:“我们是云工程师,因此我们认为事物应该水平扩展、具有弹性、能够自动执行且可重复数百次;而不应集中管理,也不会因单个开发人员的问题而影响其他人。”
Torc 测试了各种 VDI 解决方案。自 2020 年成为 AWS 的客户以来,该公司一直想要了解 AWS 能提供什么。Fox 表示:“只要有可能,我们就会高度依赖 AWS 提供的托管服务,这样我们便能把更多的精力放在思考如何编写代码和让卡车运转上。AWS 提供的服务对这个项目也非常适用。” Torc 与 AWS 团队合作测试了 Amazon DCV。该解决方案对该公司来说非常适用,而 Torc 最终将其作为内部 VDI 解决方案 VDI Ranch 的主要组件加以使用。
解决方案 | 利用 Amazon DCV 在不到 5 分钟的时间内启动 GPU
VDI Ranch 背后的主要原则是能够根据需要启动和关闭实例。Fox 说:“我们坚决认为,在云计算环境中,服务器就应该像牛马一样,而不是宠物。我们应该在云中设立易于复制的服务器,这样一来,当服务器出现问题时,您就可以将其删除并启动另一台服务器。您不必像对待宠物那样喂养和照顾它。” 实际上,VDI Ranch 中有一个选项是“替换实例”按钮。如果服务器出现问题,开发人员只需将该实例替换为新实例即可,从而保持其数据和设置完好无损。
VDI Ranch 为近 300 名开发人员和工程师提供自助式终端用户计算环境,因此这些开发人员和工程师可以在不到 5 分钟的时间内访问所需的计算资源,而不必提交票证并等待数天时间才能获分配资源。这便极大提高了开发人员的生产力。
借助 VDI Ranch,Torc 可以利用 Amazon Elastic Compute Cloud(Amazon EC2)让开发人员灵活访问 GPU 和其他高性能计算资源,而 Amazon EC2 几乎可以为任何工作负载提供安全且可调整大小的计算容量。Fox 表示:“利用 AWS 和 Amazon DCV,我们可以更简单轻松地在开发人员需要时为他们提供 GPU 马力。我们无法为笔记本电脑甚至台式电脑提供与 Amazon EC2 实例同样的 GPU 功能,而且它非常灵活,因此我们可以在不再需要时将该实例关闭。” VDI Ranch 现可为 Torc 软件开发的每个主要领域提供支持。
Torc 在 VDI Ranch 内部实施了自动治理和安全控制,包括将 VDI Ranch 与 Torc 的第三方身份和访问管理解决方案集成。Torc 还在 Datadog 中实施了可观测性仪表板,以跟踪联网和计算实例性能。这些仪表板由支持 VDI Ranch 的云工程师使用,这就有助于 Torc 更轻松地为其远程员工进行技术问题故障排查,从而提高性能和缩短延迟。
借助 VDI Ranch,Torc 云工程团队还能标准化 Torc 员工使用的硬件,从而提高安全性和故障排除,同时仍为工程师提供使用他们首选操作系统的开发环境。对于承包商,Torc 会使用 Amazon WorkSpaces,而该服务会提供完全托管的虚拟桌面。Fox 表示:“利用 Amazon WorkSpaces,我们可以获得托管 VDI 所带来的诸多好处,包括分割员工和承包商的工作负载,而且不必管理 Windows 映像。”
成果 | 利用 AWS 改进远程开发
在该公司努力推出其自动驾驶卡车的同时,Torc 将继续提升其开发人员的 VDI Ranch 用户体验。该公司最近部署了一个系统,可以智能关闭未使用的实例,并在 FinOps 仪表板中构建特定于 VDI 的计算优化器,从而帮助用户合理调整其计算资源。这些措施将有助于实现更好的优化效果以及更低的成本。
Fox 表示:“如果过去 2 年 AWS 团队并未与我们合作,则这个项目不可能完成。如果一家供应商能够了解我们的挑战并帮助我们找到解决方案,我想不出还有什么比这更好的供应商关系了。”
利用 AWS 和 Amazon DCV,我们可以更简单轻松地在开发人员需要时为他们提供 GPU 马力。
Jason Fox,
Torc 高级工程经理