关于比亚迪“天神之眼”计算平台的算力设计(预计500-1000 TOPS),其技术路径和行业意义值得深入探讨。以下从实现方式、技术挑战和行业影响三个维度展开分析:
1. 多芯片互联的技术实现路径
(1)芯片选型方案
- 英伟达Thor方案:
- 单颗Thor芯片算力达2000 TOPS,但比亚迪可能通过降频/裁剪模块实现功耗与成本平衡(如启用50%算力)。
- 优势:直接获得成熟的CUDA生态,快速部署BEV算法。
- 地平线征程6集群:
- 单颗征程6算力560 TOPS(INT8),通过PCIe 5.0互联2颗芯片实现1000+TOPS。
- 优势:国产化供应链,支持定制化指令集。
- 自研ASIC+第三方IP:
- 类似特斯拉Dojo模式,自研NPU加速器(如专注Occupancy网络计算)+ 外购CPU/GPU IP。
(2)互联拓扑结构
- 共享内存架构:
- 通过Chiplet技术(如台电InFO-SoW封装)实现芯片间超低延迟通信(<1μs)。
- 典型案例:AMD MI300X的GPU+CPU混合封装。
- 分布式计算:
- 按功能划分算力单元(如1颗芯片专处理激光雷达点云,1颗运行BEV模型),通过以太网TSN同步数据。
(3)能效优化
- 动态算力分配:
- 城区场景激活全部算力(1000 TOPS),高速巡航仅启用200 TOPS以降低功耗。
- 液冷散热:
- 参考蔚来ADAM平台的液冷模块,确保高负载下芯片温度<85℃。
2. 技术挑战与突破点
(1)芯片间通信瓶颈
- 带宽需求:
- BEV模型参数量约1-10B,芯片间需传输高达100GB/s的中间特征图。
- 解决方案:采用HBM3高带宽内存(如SK海力士的6.4Gbps HBM)。
(2)软件栈适配
- 编译器优化:
- 需重构深度学习编译器(类似特斯拉的PyTorch2.0优化),使Transformer模型能自动拆分到多芯片。
- 实时性保障:
- 多芯片任务调度延迟需控制在10ms级(否则影响AEB响应)。
(3)成本控制
- 芯片良率:
- 7nm Chiplet设计的良率可能低于60%,需与封测厂(如日月光)深度合作。
- BOM占比:
- 目标将智驾硬件成本控制在整车5%以内(1000 TOPS方案约8000元/车)。
3. 行业影响与差异化
(1)对比行业方案
方案 | 算力(TOPS) | 特点 | 代表车型 |
---|---|---|---|
比亚迪天神之眼 | 500-1000 | 多芯片互联+无图BEV | 仰望U9 |
特斯拉HW4.0 | 720 | 纯视觉+Dojo训练 | Cybertruck |
华为MDC 810 | 400 | 车云协同+鸿蒙生态 | 问界M9 |
英伟达Thor单芯片 | 2000 | 舱驾一体 | 极氪009改款 |
(2)比亚迪的核心优势
- 垂直整合能力:
- 电池管理系统可优先为智驾芯片供电(如刀片电池直供12V电源)。
- 数据规模壁垒:
- 2024年保有量超600万辆,年新增数据量相当于Waymo的100倍(非公开数据估算)。
(3)潜在合作方
- 黑芝麻智能:A2000芯片支持多片互联,提供国产化备选方案。
- 寒武纪:MLU370-X8集群经验可迁移至车规场景。
4. 量产展望
- 工程验证阶段:
- 2024年完成-40℃~105℃环境测试(吐鲁番/黑河极限测试)。
- 落地时间表:
- 2025Q2:首搭仰望U9(限量版),支持城区记忆泊车+红绿灯启停。
- 2026年:下放至腾势品牌,实现20万元级车型标配500TOPS。
结语
比亚迪的1000TOPS级方案不仅是算力堆砌,更是芯片架构、算法效率、能源管理的系统工程。其成功将取决于:
- 能否突破多芯片间纳秒级同步技术;
- 能否建立比特斯拉更高效的中国场景数据闭环;
- 能否在成本与性能间找到规模化平衡点。
这或将成为中国车企冲击L4级自动驾驶的关键一役。