亚马逊AWS官方博客
亚马逊云科技 AD Insight Hub,全链路解决方案解决辅助驾驶开发过程中的数据挑战
![]() |
智能驾驶加速演进,数据成为核心驱动力
当前,全球汽车行业正经历从“电动化” 向 “智能化” 的深度转型,辅助驾驶作为智能汽车的核心功能,已成为车企差异化竞争的关键赛道。L2 + 级辅助驾驶车型渗透率持续提升,消费者对高阶辅助驾驶(如高速 NOA、城区 NOA)的需求日益迫切。然而,辅助驾驶技术的研发过程中,数据处理效率、场景覆盖广度等核心问题,始终制约着技术迭代速度与商业化落地进程。
一方面,智能驾驶车辆搭载的激光雷达、毫米波雷达、摄像头等多传感器,每天可产生40-80TB 的原始数据,海量数据的存储、筛选、标注与应用成为研发痛点;另一方面,真实道路中的危险场景(如极端天气、突发事故)难以大量采集,且实地测试成本高、周期长,无法满足辅助驾驶系统对 “亿级公里” 测试里程的需求。在此背景下,亚马逊云科技凭借在云计算、生成式人工智能、大数据领域的技术积累,为辅助驾驶企业提供全链路解决方案,助力突破研发瓶颈。
辅助驾驶研发的核心挑战:数据与场景的双重困境
辅助驾驶研发围绕 “数据 – 模型 – 仿真” 展开,每个环节的痛点均需通过高效数据处理能力解决,而传统方式难以满足需求,具体表现为:
-
Bounding Box 标注:人工效率低、成本高,无法匹配数据增长速度
感知模型训练需大量目标检测标注(如车辆、行人的 Bounding Box),传统人工标注需上大量标注人员并行推进,面对日均 PB 级新增数据,标注效率远低于数据产生速度;同时,人工标注需反复校验,管理成本高,难以支撑核心模型的并行训练需求。
-
场景标注:语义信息缺失,人工补标周期长
模型训练不仅需目标标注,还需 “环境 – 行为 – 风险” 等语义标签(如 “雨天 + 城市道路 + 车辆急刹”),传统人工标注仅能完成目标框绘制,语义标签需额外投入人力补充,单段视频语义标注耗时长,且标签维度不统一,无法快速适配多模型训练需求。
-
场景搜索:关键数据难找,研发效率受困
辅助驾驶模型优化需聚焦边缘场景(如暴雨天无保护左转、暴雪天车辆打滑),这类场景在真实数据中占比较低,传统基于人工标签的检索方式,无法精准匹配相似场景,工程师查找目标数据需耗时数天,严重拖慢模型迭代节奏。
-
仿真场景生成:危险场景复现难,传统工具效率低
极端天气(团雾、冻雨)、突发事故(多车追尾、道路塌陷)等危险场景,实地测试无法主动触发,传统仿真工具需手动搭建场景,单一场景生成耗时超 24 小时,且难以模拟真实物理规律,生成场景与实车测试差异大,模型验证效果不佳。
亚马逊云科技 AD Insight Hub 解决方案
针对辅助驾驶研发的核心流程,亚马逊云科技 AD Insight Hub 以多模态大模型为核心,解决辅助驾驶开发过程中的数据挑战。
-
基于多模态大模型的 Bounding Box 自动标注
针对人工标注效率低、成本高的痛点,AD Insight Hub 依托 Amazon Bedrock 多模态大模型,模型通过学习海量标注数据,可自动识别图像 / 视频中的车辆、行人、交通标识、障碍物等目标,实现目标检测场景的 Bounding Box 自动生成。
Amazon Nova作为AWS原生的多模态大模型,专门针对图像和视频理解进行了深度优化,具备出色的视觉感知能力,能够精准识别和定位自动驾驶场景中的各类关键目标。Nova模型经过大规模多模态数据训练,对车辆、行人、交通标识等交通场景元素具有深度理解能力,不仅能够准确识别目标类别,还能精确生成边界框坐标,大幅提升标注精度和一致性。
-
基于多模态大模型的场景标注
针对语义标签人工补标周期长、维度不统一的问题,AD Insight Hub 利用多模态大模型的场景理解能力,模型可同时分析图像 / 视频的静态信息(天气、道路类型、交通设施)与动态信息(车辆运动轨迹、行人动作),并根据要求生成描述或语义标签。
-
基于多模态 Embedding 的场景智能搜索:快速定位关键数据,突破检索瓶颈
针对边缘场景难找、检索效率低的痛点,AD Insight Hub 将数据池中的图像、视频转为特征向量,用户可通过三种方式发起检索:①输入自然语言描述(如 “傍晚雨天行人横穿马路”);②上传参考图像(如某一角度的车辆侧翻场景);③输入标签组合(如 “高速 + 团雾 + 货车变道”),模型将查询内容转为向量后,与数据池向量快速比对,返回相似场景结果。
-
基于 NVIDIA Cosmos 的仿真视频生成:大模型驱动场景生成,破解仿真困境
针对危险场景复现难、传统仿真效率低的痛点,AD Insight Hub 结合基于NVIDIA Cosmos ,用户通过 AD Insight Hub 前端输入场景描述(如“晴天的杭州西湖湖边”),然后Amazon Bedrock 中的大模型将简单描述优化为细节丰富的提示词,最后借助NVIDIA Cosmos世界模型,生成符合真实物理规律的场景视频。
NVIDIA Cosmos的核心原因在于其作为专门针对物理世界建模的世界模型,能够生成符合真实物理规律且时序连贯的仿真场景,特别是在自动驾驶领域具备专业的场景理解能力,能够安全地重现现实中难以复现的危险驾驶情况。
在AWS平台上运行这一解决方案带来了显著优势,AWS基础设施的弹性扩展能力,可以根据需求动态调配GPU计算资源和存储空间。与Amazon Bedrock中大模型的无缝协作,实现从简单文本描述到详细提示词的智能优化。通过这种云端部署方式,AD Insight Hub能够充分发挥大模型的理解能力和Cosmos的专业建模能力,为自动驾驶测试提供高质量、大规模的仿真场景生成服务。
![]() |
![]() |
解决方案架构图
![]() |
亚马逊云科技 AD Insight Hub 解决方案架构遵循 “模块化、可扩展” 原则,以多模态大模型为核心,依托 AWS 核心服务构建,贴合辅助驾驶研发数据流转逻辑。
1、前端交互与内容分发:数据工程师通过静态页面访问系统,请求首先经过Amazon CloudFront进行内容分发,然后连接到Amazon S3托管的网站,确保高效快速的前端交互体验,提供统一的用户界面用于提交自动标注、场景搜索和仿真生成等请求。
2、API统一管理层:Amazon API Gateway作为系统的统一入口点,负责处理所有来自前端的请求,实现请求路由、身份验证和流量管理。API Gateway与Amazon Cognito集成实现身份认证,通过Amazon CloudWatch进行监控,同时连接Amazon ECR和DynamoDB以支持容器化部署和数据存储。
3、核心处理逻辑层:在虚拟私有云(VPC)环境内,系统部署了多组Lambda函数,包括Datasets API、Models API、Batch API和Tasks API,这些函数共同构成AD Insight Hub的核心业务逻辑处理单元,负责数据集管理、模型调用、批处理任务和任务状态追踪等功能。
4、工作流协调层:AWS Batch与Amazon SQS(简单队列服务)协同工作,AWS Batch负责管理计算资源和运行批处理作业,而Amazon SQS确保消息的可靠传递,共同实现工作负载的高效协调和资源优化分配,保证大规模处理任务的可靠执行。
5、数据存储与管理层:系统采用多个Amazon S3存储桶分别存储不同类型的数据:输出结果存放在Output Buckets、视频帧存储在Frame Buckets、原始视频保存在Source Video Buckets。同时,Amazon DynamoDB提供了高性能的数据库服务,用于存储和查询元数据和处理状态信息。
6、实时推理服务层:实时推理层由三个强大的AI服务组成:Amazon Bedrock提供多模态大模型能力,支持自然语言处理和视觉理解;Amazon SageMaker AI提供完整的机器学习模型开发和部署环境, 可以支持Cosmos等相关模型的部属与管理;Amazon Nova提供高性能计算能力。这些服务共同支持Bounding Box自动标注、场景智能标注、语义搜索和仿真视频生成等核心功能。
大模型驱动辅助驾驶提升研发效率
亚马逊云科技 AD Insight Hub 通过多模态大模型技术,精准对应辅助驾驶研发四大核心痛点,实现全链路效率跃升与成本优化。针对Bounding Box标注效率瓶颈,Amazon Nova多模态大模型实现自动化目标检测标注,显著降低标注成本并确保一致性和准确性;针对场景语义标注周期长的困境,多模态大模型能够同时解析静态环境信息和动态行为特征,、大幅提升标准化程度;针对边缘场景检索难题,基于多模态Embedding的智能搜索系统支持多种检索方式,大幅提升检索准确率;针对危险场景仿真复现难点,NVIDIA Cosmos与Amazon Bedrock的协同方案将传统需要超长时间的单场景手动构建优化为分钟级的智能化生成,生成场景数量大幅提升且物理规律一致性显著优于传统仿真工具。
该解决方案凭借AWS的技术优势,为辅助驾驶行业带来革命性变革。AWS云原生架构提供的弹性扩展能力和全球化部署支持,让企业能够灵活应对大规模数据处理挑战,实现成本可控的敏捷研发;Amazon Bedrock多模态大模型的深度融合,突破了传统单一模态处理的局限性,为复杂驾驶场景的智能化理解和生成奠定了坚实基础;端到端的完整解决方案架构消除了数据孤岛和集成复杂性,构建了从数据处理到模型验证的无缝研发链路。
展望未来,随着生成式AI技术的持续演进和边缘计算能力的深度融合,AD Insight Hub将进一步优化多模态处理能力,拓展更多智能化应用场景,助力企业在从L2+向更高级别自动驾驶的技术跃迁中保持领先优势。这一创新解决方案不仅重新定义了辅助驾驶的研发模式,更为整个智能汽车产业的可持续发展提供了强有力的技术支撑,推动行业向更安全、更智能的未来加速迈进。
*前述特定亚马逊云科技生成式人工智能相关的服务目前在亚马逊云科技海外区域可用。亚马逊云科技中国区域相关云服务由西云数据和光环新网运营,具体信息以中国区域官网为准。