一、引言
每一次极端天气下的紧急制动,每一段复杂路况中的精准识别,本质都在考验算法对现实世界的适应能力。因此,我们可以看到在智能辅助驾驶从“功能验证”到“场景攻坚”的关键阶段,真实、高质量的数据是算法性能提高的基石。尤其在极端天气、颠簸路面和电磁干扰等恶劣工况下,如何实现多源传感器数据的高可靠采集、高精度同步与高效率处理,是行业中常遇到的难题。
下文将结合行业实践,系统拆解多总线(CAN/LIN/100BASE-T1等)数据采集方案的核心痛点、架构设计、同步策略与系统搭建,为从事智能汽车数据闭环开发的工程师提供一套可落地的技术参考。
二、关键技术挑战
多总线数据采集常被简化为硬件连接问题,但在工程化落地时,需系统应对四重挑战,这直接决定了数据能否真正用于算法迭代。
协议与接口复杂:常用一套硬件同步采集车载以太网、CAN/CAN FD、FlexRay、LIN及多路视频,并支持灵活扩展以适应不同测试场景。
时间同步要求极高:多传感器数据融合依赖纳秒级时间对齐,且须在系统启动异常(如时间复位)等边缘场景下保持同步不中断。
车规级可靠性严苛:系统在-40℃~85℃、持续振动及强电磁干扰环境中稳定运行,并通过冗余设计杜绝数据丢失。
数据需直接赋能算法:采集系统应支持基于工程数据库的信号级解码,并输出与平台无缝衔接的格式,提升数据可用性。
三、硬件架构设计
为应对上述挑战,硬件系统需采用模块化、车规化、高密度的设计思路。以下是一个经过验证的架构实例:
(1)核心记录单元:采用强固型工控机,采用宽温操作与丰富扩展槽,为后续扩展提供地基。
(2)总线采集网络(关键):
-
a. 以太网部分:通过 CM 100 HIGH 模块接入多达12路100BASE-T1车载以太网,这是智驾数据主干。
-
b. 传统总线部分:CM CAN COMBO 模块可灵活配置,单模块提供6路CAN/CAN FD + 1路FlexRay,通过组合满足不同车型需求。
(3)网关与交换:Enhanced Ethernet Switch 实现多路数据汇聚,并通过万兆光口上传,避免数据瓶颈。
(4)视频输入:采用支持UVC协议的工业相机,通过USB3.0接入,由软件实现多路视频帧级时间对齐。
该架构的精髓在于“模块化”:工程师可根据具体车型的拓扑(如集中式E/E架构或域控架构),像搭积木一样增减对应的采集模块,而非重新设计整个系统。
四、同步策略
同步方案采用 IEEE 802.1AS(gPTP) 作为骨干协议,并设计了智能策略应对复杂场景:
(1)主从同步(正常工况):以智能驾驶域控制器为全局时钟源(Master),通过支持gPTP的交换机,以透明时钟(Transparent Clock) 模式逐级向下游采集模块(Slave)授时,补偿传输延迟,实现全网纳秒级同步。
(2)混合同步(边缘场景):当检测到域控制器时间为初始值(如1970年),系统自动切换至“NTP + gPTP”融合模式:
(3)秒级以上时间由工控机通过NTP从可靠源(如GPS)获取。
(4)亚秒级(纳秒精度)仍通过gPTP与域控的硬件时钟保持同步。
(5)智能判决服务持续监测,待域控时间恢复正常后,无缝切回纯gPTP模式。
五、软件系统搭建
软件将硬件采集的原始比特流,转化为可供分析的价值数据流。
(1)采集层:采用 DPDK对万兆以太网数据进行“零拷贝”抓取,极大降低CPU开销与延迟。视频采集则通过 V4L2 框架。
(2)存储管理层:设计环形缓冲区与文件轮转策略(例如:单个文件达10GB或时长达30分钟即新建文件),平衡写入效率与文件管理便利性。支持 PCAPNG(网络帧)、ROS2 Bag(视频与自定义消息)等格式并行落盘。
(3)服务层:
a. 实时可视化:将指定总线数据流实时转发至 CANoe 等专业工具,实现信号级在线解析与绘图。
b. 统一配置平台:基于Web的GUI,可集中配置所有分散的总线采集模块参数(如CAN波特率、以太网VLAN),提升运维效率。

c. 数据交付:可按算法团队需求,自动将数据转换为 MDF、BLF、ASC 等不同格式,并推送至指定存储或云平台。
六、总结
一套能支撑智能驾驶研发的数据采集系统,不是通过接口设备的简单堆砌。它常需要满足以下要求:
硬件层面:以车规级可靠性为基础,用模块化设计应对不确定性。
同步层面:以高精度协议为基准,用智能策略应对真实世界的复杂场景。
软件层面:以高效采集为核心,以服务化思想提供数据价值。
通过这样的方式,数据才能从测试车采集流程中,高效转化为驱动算法迭代的高价值资产。