亲历中国智驾大战,吴新宙加入NVIDIA半年后首秀

‍作者 |张祥威

编辑 |德新

549e1a7c78f818c0154122a717030afe.jpeg

吴新宙近日现身NVIDIA GTC,这是其从小鹏汽车离开加入NVIDIA之后的首次公开亮相。

吴目前担任NVIDIA汽车事业部副总裁,全面负责NVIDIA的车载计算产品线DRIVE平台的产品定义以及工程落地工作。吴新宙最广为人知的经历,是在中国市场与小鹏汽车一起打造彼时最强的智驾系统,可以说是推动智驾量产数一数二的领军人物。

在GTC的现场,吴新宙发表了题为《加速向AI定义汽车时代转变》的演讲,介绍了NVIDIA对于AI以及汽车变革的思考

  • 汽车如何从软件定义汽车向AI定义汽车转变?
  • 未来的自动驾驶技术栈如何变成端到端的范式?
  • 如何真正打造能够长时间连续决策的智能汽车?

在吴新宙看来,自动驾驶的研发重心将向云端转移,随着软件定义汽车的成熟,以及要解决更多的Corner Case,自动驾驶会迎来新的开发范式。生成式AI和LLM,将有可能解决这些更复杂的问题,打造一个真正类人的高阶自动驾驶技术栈。

以下是吴新宙在GTC上的演讲,HiEV做了不改变原意的删减:

一、三大趋势重新定义汽车

欢迎大家参加NVIDIA GTC的DRIVE开发者日。

我是吴新宙,担任NVIDIA汽车事业部副总裁。我是最近在6个月前加入的NVIDIA,负责整个汽车业务部门,主要职责是为Drive平台制定产品定义,以及做好相应的工程落地。

今天,我将谈谈「AI定义汽车」,这一不可逆转的未来趋势,以及NVIDIA在这一领域正在做什么,从而加速向人工智能定义车辆的转变。

按照议程,首先我将谈一谈我们的发展历程,以及驱动下一波创新并将其应用于AI定义汽车的主要因素是什么,之后是NVIDIA在这个领域做了什么。

过去十年的汽车行业发生着诸多令人惊叹的变化,也许是百年汽车业未曾见过的。我认为,过去10年,三大趋势对汽车行业进行了重新定义。

b873560fe26f62e5f27627b445de9700.jpeg

第一,电动化。为了建设一个更清洁、更环保的世界,汽车行业已经采取措施引入越来越多的电动汽车。这里有一些数据,我认为总体预测来看,到2030年在全球范围内的新能源渗透率将在20% - 30%之间。

但在中国,今年3月份的新能源车渗透率将超过50%,是一个令人印象深刻的里程碑。

第二,智能化。这一点也非常重要,基本上是为座舱和自动驾驶引入更智能的能力,本质上是对人类出行的辅助。

我们都知道摩尔定律,Jensen也谈到加速计算是如何定义摩尔定律。汽车行业很好地代表了这种,超级摩尔定律在过去十年中带来了诸多迅速的变化。

就NVIDIA而言,我们的第一个产品是Tegra Parker,然后又推出了25 TOPS的Xavier。在那之前,市场上的产品都是2 TOPS级别。当我们推出Orin X时,与Xavier相比,算力又扩大了10倍。

今天我将谈谈下一代平台,也是最新一代的为汽车而生的超级计算机,大概是Orin X的4到5倍

我们每两年都会看到,在汽车的计算需求尤其是自动驾驶方面,会有10倍的增长。

众所周知,自动驾驶处于进行时,我有一些中国市场的经验。今天在中国,如果一辆车没有一些先进的ADAS功能就很难卖出去。例如,像华为这样的头部品牌,选配与不选配高阶智驾功能的比例,基本是4:1。

这说明,ADAS能帮人开车,缓解驾驶焦虑和疲劳,我认为这股浪潮最终会在全球范围内发生,我们将在未来十年看到,对汽车智能化功能的需求越来越多。

第三,OTA能力。购买可以OTA的车,意味着买车不是买硬件,而是买服务。买完车后,它在持续学习、进化,不断获得新功能。今天拥有一辆能进化的汽车,是非常令人兴奋的。

这就是今天的现状。

二、迈向「AI定义汽车时代」

我认为下一个趋势,也正是我的GTC的演讲主题,就是我们正在从软件定义汽车走向AI定义汽车

d5fb68d5b56fd10b1d7f98c193f26863.jpeg

有三个因素推动了这一趋势的发展:

第一,对于几乎所有主机厂而言,随着软件定义汽车逐渐成熟,甚至几乎每辆车都可以变得非常舒适,软件定义汽车已经无处不在。

第二,自动驾驶堆栈的演变,从一个经典的堆栈开始,然后我们使用AI来增强感知的组件,它会进入一个端到端的自动驾驶模型的堆栈。

实际上在最近,让所有人惊讶的是,这种情况发生得如此之快,而且还在持续发生。

这就是生成式AI。有了Transformer、LLM、VLM和稳定扩散,我们看到了很多基于生成式AI的惊人的基本能力和新能力。与我们熟悉的基于卷积的人工智能相比有本质区别,它实际上是关于在空间和时间上创造交叉注意力的能力。

为什么这很重要呢?

卷积网络仍然是基于接近度的,试图找到特征,查询特征,空间或时间,显然我们使用的是IM类型的时间结论。但有了Transformer,我们可以获得图像中任何两个像素在时间和空间上的相关性,这将大大增强我们理解复杂事物的能力。与时态相同的是,具有注意力交叉的能力。

现在我们可以进行长期推理了,这是一个非常困难的问题,人工智能几十年来要实现的目标,是能够跨时间,也就是跨秒、跨分钟甚至跨小时进行推理。有了LLM,我们已经证明网络能够在整个人类文学中进行训练,这是一个非常重要的突破,如今,我们又在目睹AI在视频领域的突破。

我想说的第三件事,那就是训练的能力,拥有基础设施和计算机能力,能够通过大量数据进行训练。

我认为这是另一件非常重要的事情,这无关生成式AI,而是我们存在的基石,大家知道人工智能是如何迅速地向我们走来的。

三、自动驾驶的开发重心向云端转移

1c31f7056e3b690a9a9750bd582aaa03.jpeg

那么,以上这些对自动驾驶堆栈意味着什么呢?

正如我所说,自动驾驶从一个经典的或基于规则算法的堆栈开始。

然后是AI增强堆栈。我们首先使用卷积基础网络进行感知,然后使用基于Transformer的网络进行感知BEV的体现。现在,这一趋势也正体现在规划中。

即使在某种意义上有这两种功能,基本上仍然存在来自当前堆栈体系结构的相当多的限制。

我把它们分为三类。

第一,堆栈,我们试图做的是真正量化人类的驾驶行为。这是什么意思?有一个模块叫做行为规划。相信你们中的许多人都在做自动驾驶,所以这个概念对这里的许多观众来说应该不是什么新鲜事。

对于行为规划,它实际上是试图定义一些行为,然后建立一个状态机来在它们之间转换,基于不同的条件,例如,LCC,一种车道居中控制。

然后我们开始引入变道,你可以认为这是另一种模式。

在城市里,这一两种行为并不能解决问题。

所以,最终人们会引入几十种不同的行为。例如,当变道时,如果知道相邻车道有车不让你这样做,你会在车道上停留一段时间,直到观察清楚对方要做什么,然后采取下一步行动。

所以,为了更好地进行行为规划,一个好的堆栈会引入越来越多的行为,让它变得越来越像人,但发现在这种看似像人的行为背后,它仍然是一组离散的行为,系统在它们之间转换。

这实际上并不聪明,因为即使对于最先进的堆栈,有时你仍然会觉得这是非人驾驶,对吧?因为我们很难量化人的行为。

第二,这也是众所周知的,受限的泛化能力。我们在很大程度上依赖于数据标注的数据集,尤其是我们看到和理解基本复杂事物的能力非常有限。如果该数据未被学习和训练,则对其进行标注。我们应该引入基础模型,我会在下面的PPT中进行更多讨论。

第三,在自动驾驶堆栈中做出连贯的长期决策的能力,这是非常困难的,因为这个堆栈的大部分,我们现在拥有的堆栈,它仍然是一种瞬态的内存系统,我有时把它描述为一条鱼7秒的记忆,这就是堆栈的现状。

在很多方面,对于一个真正类人的高阶自动驾驶堆栈,需要更多的功能。我们中间的许多人可能都有在机场找租车还车处或在机场找停车场的糟糕记忆。你目标很简单,但你知道,通常导航不会马上把你带到那里,或者机场正在施工,你必须依靠你所看到的现状,并努力在几十分钟内做出一致的决定,找到合适的路径,这种能力一直是人工智能的一大限制。

有了生成式AI和LLM,我认为我们将能够解决这样复杂的问题,我们将能够制造一个机器人或一辆可以长时间做出连续决策的人工智能汽车。

简言之,我们所做的事情有一些局限性。即使目前的第一块和第二块取得了非凡的成就,但随着生成式AI的新能力,天花板会更高。

什么是AI定义汽车?

基本上,我们在未来看到的是模型,自动驾驶堆栈将成为端到端的模型,它将在具有大量数据的云中进行训练。更重要的是,它还将在具有模拟能力的云中进行验证。NVIDIA在Omniverse和Drive Sim上的投入已有多年,我认为仿真的黄金时段已经到来,但在未来会更加重要。

a31b8d0b804f0fd96104458ed721159c.jpeg

有了仿真功能和端到端大模型,你可以发现,自动驾驶的开发重心将进入云端,而不是让庞大的工程师和庞大的车队在路上行驶。现在,您需要云计算中的大型服务器,这对NVIDIA来说是好事,我们正在实现这一点。这就是未来的道路。

很明显,在车辆中,我们将进行模型部署,在未来,OTA基本上只会进行模型更新,但让数据返回到云中非常重要,以不断完善云中的大模型。这就是我们所看到的未来。

0fd984c04e2272898c313516d3b15402.jpeg

所以,对于软件来说,划分一个我们所知道的车辆,我已经花了10年的时间来研究它,部署工作真的非常繁重。几乎所有的组件都需要大量的编码、工程师和工程,这个堆栈非常深,在路上找到他们的Corner Case识别确实需要很多时间。

L2的ADAS系统不一定是完美无瑕的,但当我们朝着L3和L4的方向前进时,当我们让人脱手时,基于安全性和Corner Case等要求,识别能力就变得非常重要

正如我们所了解,Corner Case将变得越来越少,越来越难以识别。我们必须依靠庞大的车队才能找到这些Corner Case,但这是一个非常困难的过程,必须能够开发一种非常复杂的机制,无论何时发生这种事情,都能够识别或触发记录。

四、从车端到云端,支持生成式AI落地

ec3f300d2d58e9ca376b6ebf3867f2fe.jpeg

然后,需要计算机、基础设施能够分析,并尝试在云中解决这些案例,这是一项艰巨的工作。

比如,测试基本上是大规模的里程覆盖。所以通常情况下,人们或汽车厂商只愿意在他们测试过的区域发布软件,这是一种常见的做法。意味着用要数百辆的测试车队进行数十万英里的测试。

你需要一个非常高效的基础设施实现,以便能够支持测试和数据回传,并使用这些测试数据来支持开发,我们称之为数据飞轮

我们希望在AI定义汽车时代,简化传统的大规模的运营和OTA部署工作,让大量的工程师成为云计算的巨大力量。我们将大部分训练在云端进行,测试将主要在模拟中进行验证,OTA更多是为了大模型。NVIDIA正在做一些事情来实现这一点,那就是加速人工智能时代定义汽车这一趋势。

所以,Drive平台几乎是端到端的,从芯片到安全平台,再到全栈,我的团队很大一部分工作是开发Full Stack-NDAS 堆栈和数据中心基础设施。

我会快速谈一下这些不同的要素。

Thor,这是我们这一代的超级计算机。它具有1000 Tops的计算机功能,是上一代芯片Orin X的4倍。包括630K DMIPSCPU算力,是Orin X的2.5倍。我们的主机厂合作伙伴越来越多,包括中国的自动驾驶开发商OEM,包括理想汽车和比亚迪。

我们所做的一个重要改变是在Thor和Blackwell Hopper中,基本上是FP4,浮点4位,支持计算机的操作系统。这实际上非常重要,因为当内存带宽限制为4位时可以进行更有效的计算。

有了这些改进,就可以实现4倍于Orin X的提升。通过一些技巧,我们希望基于LLAMA-7B模型实现9倍的提升,Thor可以原生支持Transformer,相信可以成为支持人工智能的开放Soc

这就是NVIDIA的Drive平台,从芯片到云。我们有两台计算机,一台在车里,另一台在云中。

我们正在做很多工作,比如,在推理芯片和云端芯片中,引入大规模的生成式AI兼容计算能力,我们正在非常努力地使这一过程中的每一步都成为安全客户端。在软件方面,我们正在引入生成式AI和基础模型,以填补推理模型和模拟的未来能力。

未来,我们希望Drive是一个开放的平台。如果OEM希望一直合作,我们是非常开放的。如果只是想从我们现有的东西中获得一部分服务,我们也很乐意与之合作。

我们会再次看到,汽车的计算机将开始引入这种端到端的基于模型的能力。同时,仿真能力也非常重要,我们将努力地实现像素场景和行为等的保真度。此外,我们还将引入基础模型作为人工智能模型。谢谢大家。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/776906.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

3.28C++

复数类的实现&#xff0c;写出三种构造函数&#xff0c;算术运算符、关系运算符、逻辑运算符重载尝试实现自增、自减运算符的重载 #include <iostream> using namespace std; class Num {int rel; //实部int vir; //虚部 public:Num():rel(2),vir(1){}Num(int rel,…

深入解析RSA算法原理及其安全性机制

码到三十五 &#xff1a; 个人主页 心中有诗画&#xff0c;指尖舞代码&#xff0c;目光览世界&#xff0c;步履越千山&#xff0c;人间尽值得 ! 目录 一、RSA算法简介二、RSA算法原理2.1 背景与数学基础2.2 密钥生成2.3 加密过程2.4 解密过程 三、安全性考虑四、RSA的使用五、…

数据结构进阶篇 之 【二叉树链序存储】的整体实现讲解

封建迷信我嗤之以鼻&#xff0c;财神殿前我长跪不起 一、二叉树链式结构的实现 1.二叉树的创建 1.1 手动创建 1.2 前序递归创建 2.二叉树的遍历 2.1 前序&#xff0c;中序以及后序遍历概念 2.2 层序遍历概念 2.3 前序打印实现 2.4 中序打印实现 2.4 后序打印实现 2.…

SpringBoot项目启动成功,但是调用接口直接报NOT FOUND 404

问题描述 SpringBoot项目启动成功&#xff0c;但是调用接口直接报NOT FOUND 404 解决办法 启动类中ComponentScan(basePackages {“com.afclab”})中的扫包路径和项目路径不一样&#xff0c;导致扫不到Controller等组件&#xff0c;修改成和项目路径一样就可以解决&#xf…

MYSQL高阶语句(一)

目录 一、常用查询 1、order by 按关键字排序 1.升序排序 2.降序排序 3.结合where进行条件过滤再排序 4.多字段排序 2、区间判断及查询不重复记录 1. and / or 且与或的使用 2.嵌套、多条件使用 3.distinct 查询不重复记录 3、GROUP BY 对结果进行分组 4、Li…

独立站攻略|如何使用SEO代理优化网站排名?

每天&#xff0c;互联网上都会生成和共享大量信息&#xff0c;这使得预测哪个关键字或主题将成为趋势变得很有挑战性&#xff0c;因此人们可以预测和优化他们的搜索引擎排名。但使用“SEO 代理”&#xff0c;就会使得SEO优化更加有效且精准。 一、什么是SEO&#xff1f; 简而言…

2024 年广西职业院校技能大赛高职组《云计算应用》赛项样卷

#需要资源&#xff08;软件包及镜像&#xff09;或有问题的&#xff0c;可私博主&#xff01;&#xff01;&#xff01; #需要资源&#xff08;软件包及镜像&#xff09;或有问题的&#xff0c;可私博主&#xff01;&#xff01;&#xff01; #需要资源&#xff08;软件包及镜…

Ainx的多路由模式

&#x1f4d5;作者简介&#xff1a; 过去日记&#xff0c;致力于Java、GoLang,Rust等多种编程语言&#xff0c;热爱技术&#xff0c;喜欢游戏的博主。 &#x1f4d7;本文收录于Ainx系列&#xff0c;大家有兴趣的可以看一看 &#x1f4d8;相关专栏Rust初阶教程、go语言基础系列…

ubuntu的常用操作

一、用户 1.1 创建新用户 1.1.1 添加、修改、删除 1.2 超级用户root 切换到root用户&#xff0c;有全部权限&#xff0c;可以直接使用任何命令。 我们在什么时候才会切换到root用户进行操作呢&#xff1f;当我们使用某些命令&#xff0c;不想前面一直加sudo的话&#xff0c;…

2024年【道路运输企业主要负责人】考试题库及道路运输企业主要负责人报名考试

题库来源&#xff1a;安全生产模拟考试一点通公众号小程序 道路运输企业主要负责人考试题库根据新道路运输企业主要负责人考试大纲要求&#xff0c;安全生产模拟考试一点通将道路运输企业主要负责人模拟考试试题进行汇编&#xff0c;组成一套道路运输企业主要负责人全真模拟考…

冥想打坐睡觉功法

睡觉把手机放远一点&#xff0c;有电磁辐射&#xff0c;我把睡觉功法交给你&#xff0c;这样就可以睡好了。

『大模型笔记』提示工程、微调和RAG之间对比

提示工程、微调和RAG之间对比 文章目录 一. 提示工程、微调和RAG之间对比二. 参考文章文章:Prompt Engineering vs Finetuning vs RAG一. 提示工程、微调和RAG之间对比 Prompt EngineeringFinetuning

逆向工程-Nag.exe

初步分析 首先&#xff0c;打开文件&#xff0c;进行文件初步探索。 然后&#xff0c;点击OK发现删除本界面并跳转到新的界面&#xff0c;并且需要我们去除弹出的窗口。 正式分析 拖拽进IDA Pro 和OllyDbg中进行分析。 根据我们初步测试的结果&#xff0c;我们知道一个重要线索…

Vercel应用绑定自己的域名

准备域名 首先购买自己的域名&#xff0c;可以选择以下渠道进行购买&#xff1a; NamesiloGodaddy腾讯云阿里云 另外你还可以选择从以下平台获取到免费的域名&#xff1a; Freenomeu.org 欧盟组织的免费域名, 需要英国的用户信息才能注册; 在我看来免费的才是最贵的&#…

Rsyslog 日志集中管理实验

1.使用 进行日志集中管理 C/S 架构&#xff1a;客户端将其日志上传到服务器端&#xff0c;通过对服务器端日志的查询&#xff0c;来实现对其他客户端的日志进行集中管理 2.两台机器&#xff1a; &#xff08;server&#xff09;host-5(192.168.1.2)<------------>(192…

一招让你的薪水暴增,每个程序员都应该学会跟老板提加薪

为什么要学会薪资谈判&#xff1f; 在最近的一篇文章中&#xff0c;职业专家奥斯汀贝尔卡克 (Austin Belcak ) 解释了进行一点薪资谈判如何对您的长期收入产生巨大影响。 这是奥斯汀在他的薪资谈判示例中描绘的场景&#xff1a; Amari 和 Taylor 的年薪均为 50,000 美元 未来…

【QT入门】 Qt代码创建布局之水平布局、竖直布局详解

往期回顾&#xff1a; 【QT入门】 Qt实现自定义信号-CSDN博客 【QT入门】 Qt自定义信号后跨线程发送信号-CSDN博客 【QT入门】 Qt内存管理机制详解-CSDN博客 【QT入门】 Qt代码创建布局之水平布局、竖直布局详解 先看两个问题&#xff1a; 1、ui设计器设计界面很方便&#xf…

spring-boot-devtools配置和原理

一、前言 昨天&#xff0c;一个同事Eclipse在启动SpringBoot项目时一直不停地加载&#xff0c;后来发现是因为spring-boot-devtools造成的问题&#xff0c;因为我们把日志输出的目录设置在当前项目里&#xff08;~/mnt/logs/&#xff0c;这样设置是因为mac电脑没有根目录权限&…

摸鱼工具—终端热搜榜,实在是上班摸鱼必备之工具,妙啊

本文介绍我用Python语言开发的热搜榜&#xff0c;聚合有百度、头条、微博、知乎和CSDN等网站热搜信息。该工具运行于终端中&#xff0c;比如cmder、powershell或者git bash等&#xff0c;实在是上班、摸鱼之必备工具。 —、工具执行效果 1.1 项目代码 项目代码地址存在gitee中…

Linux用户及用户组权限

一、用户和用户组 功能项命令实例作用用户组cat /etc/group查看当前系统存在的用户组groupadd testing添加一个新的用户组testingcat /etc/group查看组是否被新增成功groupmod -n test testing将testing重命名成testgroupdel test删除组testgroups root查看用户root所在的所有…