登录注册
新能源热门车型智驾能力评测及比对
雄雄投研
2023-06-27 16:51:06

本文是非专业评测及比对

   事实上我认为市面上所有关于某车型智驾能力的评测与比对都是非专业的,因为要做真正专业的评测比对,有两个必要条件:1)控制变量,不同车型应该在同一路段、大致相同的路况条件下运行自动驾驶功能。另外,有图、无图无法直接比对,有图车型应该让厂商按照自己的标准进行测量、预训练,再与其他有图车型比较;无图车型应该都在没有跑过的路段进行比较。2)精确度,专业的评测应该尽可能精确,需要掌握路段环境以及车辆运行的精确数据,甚至要搭载对周边环境进行扫描建模的专业设备

   从这两个条件出发,目前关于不同车型自动驾驶能力的评测、讨论大多不够严谨(而且大多还带有明显的偏向性),所以几家企业的自动驾驶实力到底如何,我认为尚无定论,我们只能是猜测、推理、跟踪

   本文也无法满足上述两个条件。在控制变量方面,难以找到(未经剪辑的)不同车型在同一路段、同一路况下的自动驾驶视频,也不清楚视频中车辆是以无图还是有图模式自动驾驶,包括自动驾驶系统的版本和开发程度也不确定。在精确度方面,更不可能获得精确数据。因此本文的评测、比对仅供参考,仅代表本人个人意见,不反映各家自动驾驶的真实水准。

 

新能源热门车型智驾能力非专业评测及比对


 

1. 评测车型及数据

   车型包括:问界M5智驾版、理想L8 Max、小鹏P7i、蔚来ET7。四款车型均搭载11-12个摄像头、12个超声波雷达、1-5个毫米波雷达、1-2个激光雷达,可以认为他们在硬件层面的感知能力大致相当。

   对每款车型,在B站检索相关的自动驾驶视频,去除可能有明显偏向的(例如软广)、有过多剪辑痕迹的、视频时间短于5分钟的,优先选择清晰呈现出周边环境、车辆行驶路径、车内屏幕上对周边环境感知图像的视频,再按照播放量从高到低排序,选出前三名,作为本次评测比对的数据。

   控制变量的问题前面已经解释了,难以控制,因此只是非专业评测。确实有视频把这些车型在同一路段进行测试比较,但我认为这类视频有一定偏向性,也不确定不同车型是有图还是无图,因此剔除。

   根据以上标准,选出的视频链接如下:

   问界M5智驾版:

   1)https://www.bilibili.com/video/BV1Qh4y1R7G9/

   2)https://www.bilibili.com/video/BV1So4y1L729/

   3)https://www.bilibili.com/video/BV1ud4y1f78r/

   理想L8 Max:

   1)https://www.bilibili.com/video/BV1Fo4y1P7Mo/

2)https://www.bilibili.com/video/BV1LD4y1C7ms/

3)https://www.bilibili.com/video/BV1ja4y1A7fN/

小鹏P7i:

1)https://www.bilibili.com/video/BV16s4y1M7BT/

2)https://www.bilibili.com/video/BV1YL411C74D/

3)https://www.bilibili.com/video/BV1fh411F78p/

蔚来ET7:

1)https://www.bilibili.com/video/BV1ot4y1P7fG/

2)https://www.bilibili.com/video/BV1LM411H77Z/

3)https://www.bilibili.com/video/BV11e4y137pt/

 

2. 评测指标

   前面说到,严谨、专业的评测需要控制变量和精准的原始数据,我们没有,但依然可以参考专业的评测标准,再结合实际情况加以改动。我找业内人士拿到了一个评测标准,简单介绍一下:

   

   

 

感知评测,简单来说就是考察车辆感知系统检测到车辆、行人、车道线的精准度和覆盖率。

   

 

车道线距离稳定性评测,简单来说就是考察车辆能否稳定行驶在车道线上,当然对于现实的自动驾驶而言也不是说始终保持在车道线中央就最好,我们主观上评判一下车子在车道行驶的稳定性就可以了。

参考上面介绍的专业评测指标,我提出用于本次非专业评测的几个指标:

1)感知能力:评测者关注视频中车内小屏幕上对周边环境感知的图像,留意是否正确识别出车辆周围的车与行人、是否有错误识别或遗漏的现象,然后综合打分,1-10分。(为什么不计数或算比例,因为无法控制变量,搞定量没太大意义)

2)车道行驶自然度:评测者关注视频中车辆能否较为自然、流畅地在车道上行驶,然后综合打分,1-10分。

3)复杂状况处理能力:评测者关注视频中有无较为复杂的状况,如有的话车辆能否正确、妥善地进行处理,然后综合打分,1-10分。如果全程没有出现复杂状况则不评分。

4)考虑到不同视频路段的路况复杂程度不一样,我们给出一个参考性指标,路况复杂程度:评测者观看完12个视频后,对每段视频中总体的路况复杂程度进行打分,1-10分。同时在计算平均得分时给出一个加权平均分,即综合考虑指标得分和路况复杂程度。

 

3. 评测者

   我的朋友,不包括我自己。会开车,没有买过问界/理想/小鹏/蔚来的车或股票,对四个品牌没有明显偏好。总共3人。每人独立观看视频并完成评测表格,最后对3人的打分取平均数,同时计算3人对不同视频、不同指标打分的一致性。

 

4. 评测结果

3位评测者对不同视频、不同指标的打分的相关系数在0.48-0.57之间,属于中等程度一致,考虑到本身是要求评测者主观打分,这种程度的一致性相当不错了。

4款车型、12段视频的基本信息如下:

 

3位评测者的给分情况如下:

1号评测者

 

2号评测者

 

3号评测者

 

平均得分

 

总体来看,三位评测者的评测结果还是挺一致的。

从总平均得分来看,问界M5智驾版与蔚来ET7得分大致相当,小鹏略有落后,理想在3位评测者的评测中均为最后。

从总加权平均得分(综合考虑到指标得分和路况复杂程度)来看,问界M5智驾版“遥遥领先”,理想反而跃居第二(部分原因是视频中路段路况相对复杂),蔚来得分最后(部分原因是视频中路段路况相对简单)。

这样的评测结果当然会有争议,再次声明两点:

1)参与评测的三人没有赛力斯/蔚小理的车或股票,本身对这四个品牌、四款车型没有主观偏好。

2)本文仅是非专业评测,无法做到控制变量,然而网上那些控制了变量的评测剪辑太多、导向性太强。本文虽然存在缺陷,但至少在数据选取、指标确立、评测者评分等一系列环节下还是尽量做到明确、公平。

某些车型的粉丝或品牌股东肯定会质疑什么诸如“我家的智驾还没训练好”、“视频中的路段不足以反映我家车的能力”等等,这些质疑都有道理,但市面上没有完美的评测比对,我的评测程序至少标准明确、可复制,我觉得已经可以提供某种程度的参考价值了。

 

聊聊自动驾驶、赛力斯、帐号

1. 重视自动驾驶赛道在AI+题材的炒作合理性

   之前我曾经说过,我是比较懂AI技术的,本身现代AI技术在原理、架构上与我的本行心理学有交汇,AI模型的原理机制跟一些心理学理论(尤其是关于学习、认知等)是相通的。另外我当前的研究方向就是用AI技术展开大数据分析,我是了解一些AI模型的原理并且会写成代码用在我自己的研究中的。

   本轮由ChatGPT驱动的AI+炒作热潮,背后反映的AI领域的技术突破主要在于大模型。所以在股票社区上,AI、大模型、GPT这些词基本是混用的状态。目前来看大模型在哪些方向上有较大潜力呢?我认为最重要的是三个方向:

1)NLP,即自然语言处理,也就是一系列与语言有关的任务,如对话、翻译、校对、文本总结等。事实上大模型的底层技术(神经网络算法transformer、BERT等,更早我认为可追溯到Miklov提出word2vec用高维度对词语进行表征)大都源自NLP领域。有人认为语言是智力/智能的要素甚至是源泉,这也就不难理解为什么现阶段AI的突破大都源于语言模型的发展以及对语料的训练。

2)AIGC,即生成式人工智能,如绘画等。后来出现的一些题材、概念,如多模态智能,也与之相关。这一轮AI热潮有些人将其称为工业革命,我持保留态度,但我确实相信将来艺术创作、设计领域的低端职业都会被AI取代,比如低端画师,但是艺术家我认为不会被取代。

3)综合性认知任务,如自动驾驶,涉及到感知、决策等多个认知过程。特斯拉基本已经探明transformer算法训练自动驾驶大模型的可行性,国内厂家积极跟进。AI机器人我也将其划为这一类。

为什么当前AI+的炒作逻辑能够在各个行业扩散,我认为主要在于:

4)大模型能够与小模型/垂直细分模型结合,为垂直细分模型提供背景知识。我前面提到大模型的技术思想可以向前追溯到word2vec,word2vec原本单独作为一个模型没啥作用,他被开发出来的目的是为了给后面具体的任务(比如翻译、文本分类)提供背景知识(也就是每个单词的含义)。举个例子,假设AI模型是一个3岁孩子,你直接扔一批数据给他让他去学某个具体的任务,比如说校对,告诉他什么句子有语病什么句子没语病,孩子很难学会,因为这个孩子还什么都不懂。所以为什么AI在大模型之前一直落地困难,因为之前的AI模型大多是这种方式,通过训练集数据告诉模型正确和错误的例子,然后通过测试集数据验证效果。模型缺少背景知识,好比孩子没接受过基础教育,很难达到人类的水平。但现在大模型相当于把巨量的人类知识进行整理凝练,相当于让孩子接受了一遍基础教育,接下来再与垂直细分模型结合训练孩子去做一些具体的任务,就有希望达到与人类相当甚至更好的水平

如果不限定于大模型,当前以神经网络算法为基础的AI技术还擅长一类任务:

5)能够充分发挥经验学习优势的任务,例如下棋。AlphaGo能够阅尽棋谱而且不会忘记,从而充分从过往的棋局记录中挖掘下棋的规律。事实上我认为从这个角度理解,AlphaGo并没有什么了不起的,它能赢人类棋手的原因我认为是在于他学过、记住的棋谱更多,但并不代表它本身的智力水平多高。同理,计算器能轻易算出1596941823*85413546/54613285=?,但是你会因此认为计算器很厉害吗?

当然以上的总结也没什么营养,但接下来可能涉及到一点干货:当前AI+的题材炒作,有些不那么理解现阶段AI技术的老师,已经把(现阶段的)AI技术想的没边了。具体而言,上面我提到的我认为大模型适用的任务,实际上都是对于普通人类而言并不算困难的任务。只要没有明显智力障碍,每个人在接受必要的教育或训练后都可以理解并使用语言,进行艺术创作(当然你需要学习基础,比如练习运笔、学习音律等,很多人不会是因为没学,不是因为学不会),开车。这些任务实际上对普通人类而言,只要付出时间学习、训练,掌握必要的知识,都是可以胜任的。

而大模型目前的边界在哪里呢?大模型不可能去做对普通人类而言也不是想做就能做好的任务。举个例子,之前有个段子,说炒股的AI量化模型喂的都是短线、龙头战法,这样不好,我们应该去喂价值、长线投资理念。这很明显是不懂AI技术的人编的一个段子,因为短线投资原本就是依靠一些可量化的指标,根据历史数据掌握股价短线波动的规律,从而追求高概率的低买高卖,这一点普通人经过训练可以做好(亏钱、做的不好大多是因为没有系统训练或者心态影响),而AI可以做的比人更好。而长线、价值投资投资,则是真正具有难度的一件事情,AI大概率没法做好。举个例子,有些长线投资者经常去公司调研、约业内专家访谈,这部分的信息要怎么输入更新到模型中去呢?

说了这么多,其实我的意思是,AI+的炒作没有毛病,未来AI确实能给一些行业带来变革、创造价值,但是当前程度的概念扩散我个人觉得有些过了。现阶段最具可行性及市场空间的AI+概念,应当就是自动驾驶(综合考虑技术进度、应用前景、市场空间等因素)

 

2. 现阶段自动驾驶的重点在于数据和算力而非算法

   AI三要素,算法、算力、数据,这个想必大部分炒股的老师都很清楚了。但这里我要说的是,至少就现阶段的AI模型而言,算法的壁垒与优先级不是那么高,算力、数据相对而言更重要;而在算力不构成瓶颈的情况下,数据最重要

   如果你不懂AI的原理,可能会凭直觉觉得算法最重要。事实上我认为拉长时间看,算法确实是最重要的,它决定了AI模型的上限。然而如果你了解现阶段AI技术的基本原理,你就不会认为算法那么重要。因为现阶段AI技术的原理就是统计(经验)学习,举个例子,给你一亿个人类怎么做一项任务的例子,让模型自己去例子中寻找规律。

   这里模型怎样自己学,就是算法,但是这个算法各家基本同源且大同小异,比如现在自动驾驶基本都在用transformer。这个算法是2017年由谷歌、多伦多大学的研究者提出并发表在AI顶级学术会议Neural IPS上的,完全公开,谁都可以去github上获取研究者的原始代码。而如果你细读这篇论文,你会发现transformer的架构异常简洁,可以说对于有一定文化程度的人而言,你只要稍微去了解一下神经网络的基本概念,就能读懂并理解transformer架构。这篇文章的标题本身也说明问题,attention is all you need(你只需要注意力就够了),意思就是说我们只需要一个简单的用神经网络算法模拟注意力的机制,就可以让大模型发挥效果

   有人会问了,那现在的大模型突出一个“大”,说起来都是有多少多少亿参数,那不是很复杂吗,怎么会简单呢?模型的原理、基本单位可以简单,但是模型参数量可以越做越大。输入的数据量越多,模型要对数据进行更好地拟合,就会需要创建更多神经元和参数,但是创建神经元和参数的机制本身是不复杂的。这一点实际是符合科学的奥卡姆剃刀原理的。牛顿三定律、爱因斯坦相对论,就原理而言其实也并不复杂,可以讲给普通人听懂,但是在这基础上要对客观世界进行描绘、测算,运算可以变得非常复杂,机制、原理的简洁性与推演的复杂性是不矛盾的,甚至反而是相辅相成的:我们只有依靠简单的机制才有可能把最终的模型做复杂,如果机制就很复杂,那么很难积累整体的复杂度。

   说回正题,现阶段的AI模型,不管再怎么“大”,本质上还是对大量数据的拟合,换句话说就是“大力出奇迹”,也可以理解为“填鸭式教育”,喂给模型足够多的信息,让模型自己学去吧。这里的关键是在于数据,你需要有足够多的数据喂给模型,数据应该涵盖所有可能的情况,而且应该质量够高(否则模型拟合/学到的东西不一定对)。至于算法,相对而言没那么重要,因为大家基本都是用的类似的算法。

   有些炒股的老师可能理解AI模型是你用高级复杂的算法使得AI能够完美模拟人类任务,比如用算法指令写出什么情况下该怎么做。放在20年前,可能学界想象的AI是这个模式,但后来我们发现这条道路很难行得通,行得通的方式就是喂给模型数据,让模型自己学习。而这个自己学习的机制,目前来看没必要多复杂,“注意力就够了”!

大模型则更是简单粗暴、大力出奇迹的典型。现在自动驾驶业界有一个趋势是提倡“端到端”的模型架构,用一个模型解决直接解决自动驾驶全部流程,这就更考验数据的量级而非算法。以往自动驾驶的系统框架一般是模块化的,比如一个模型负责感知,一个模型负责规划,一个模型负责决策控制,在这种模块化思路下,每个模块要专门开发算法并进行训练,还需要进行模块间的协调整合,相对而言更考验算法;而如今如果采取“端到端”的路径,一个大模型包办大部分过程,那么重心就是用海量数据喂出海量参数,并让模型不断迭代更新

当然,大模型未必是AI的终极形态,比如AI大师、深度学习三巨头LeCun就坚持认为大模型不是未来AI的发展方向,他最新提出的模型参考了人脑的架构,实际上还是希望通过模块化的设计使得AI能够不依赖数据堆积就产生更强的学习能力。但这就不在我的讨论范围内了,我已经说明了我认为算法的重要性是对“现阶段而言”。

有人可能会问,如果有公司提出比transformer更好的学习机制,不就靠算法取得突破创造优势了吗?没毛病,但是算法的突破基本不大可能从国内这几个自动驾驶玩家中诞生(包括华为;这里花粉也没必要觉得不舒服,谷歌可以理直气壮地说他就是AI技术发展的半壁江山,很多AI技术的革新突破都源于谷歌,但是华为说实话在AI的前沿研究方面贡献不大),大概率会诞生于谷歌、斯坦福、MIT这些地方(但这也不重要,这些地方研究出来就会把成果公开,而中国人非常擅长应用公开的研究成果)。而且现在的AI研究界非常重视开源,绝大部分基础性的论文、算法、模型都是开源的。

有人可能会问,OpenAI的ChatGPT不是不开源吗,这种属于在基础性算法(例如transformer的基础上进行具体模型的训练和开发,可能也会引入一些其他开源或独创的算法架构,一般是不开源的。但是个人认为这方面的壁垒相对而言不大,在利用transformer抑或是其他神经网络基础算法,以及把模型做大的方向下,我相信很快会有模型赶上OpenAI的。当然OpenAI也不是吃素的,他们有先发优势和数据优势,会不断迭代。

综上,现阶段如果基础性算法不突破,各家训练AI模型主要比拼的是数据。即便基础性算法有突破,大概率也不构成竞争壁垒。所以对华为和赛力斯而言,尽快让更多能够采集自动驾驶数据的车子在路上跑,是当下的重中之重(对于提升长期的自动驾驶竞争力而言)。算力方面,训练端算力不构成大的壁垒,各家基本都储备了足够的算力,当前股市对AI算力的炒作实际上也客观反映了未来的扩张趋势。推理端算力(对于汽车而言也可以理解为边缘算力,假设不用云推理机制的话)有一定壁垒,这里就不展开分析了。简单来说,华为因为受到制裁可能会面临车端算力不足以支撑大模型运算的限制,但是相信M5智驾版的推出就意味着他们已经找到了解决方案。而且长期来看具有AI芯片设计能力的公司具有优势,因为能使得芯片运行自家的模型效率更高,华为是有这方面优势的

 

3. 华为/问界的智能驾驶有一个好的开局,但仍需努力

   总的来说,我认为华为/问界在M5智驾版的开发、发布以及当前的宣传上是做的不错的,可以看出准备较为充分,从而使M5智驾版至少在智驾能力上建立了相对不错的口碑。然而我认为看好赛力斯的投资者应当清楚认识到,当前的优势只是暂时的,我认为当前的优势与华为和赛力斯的准备、华为在自动驾驶技术上的积累、以及对智驾版的推广策略有关,但是未来智驾能力要进一步发展并面对竞争对手竞争,至少在当前大模型的技术路线上,关键还是在于数据的积累和模型的迭代更新

 

4. 不要纠结于纯视觉和多传感器路线

   有些投资者喜欢拿特斯拉的纯视觉路线和国内厂商的多传感器路线说事,其实这种讨论没有任何必要。特斯拉采取纯视觉方案纯粹是出于投入产出比的考虑,换句话说是特斯拉觉得在现阶段加入其他传感器(尤其是昂贵的激光雷达)对自动驾驶模型性能的提升不具备经济性。如果未来其他传感器尤其是激光雷达进一步降本(比如FMCW激光雷达的商业化),又或者特斯拉的自动驾驶系统达到了一定瓶颈,需要加入其他传感器以获得更高的感知能力/安全冗余,那么特斯拉会加入其他传感器的。另外,这也并不意味着特斯拉如果以后加入其他传感器就会落后于其他原本就采用多传感器方案的企业,对于现在大模型的技术路线而言,无非是多加一些输入参数,再让模型多迭代训练几遍而已。特斯拉在纯视觉路线下积累的数据、算法、芯片设计能力,在未来即便采取多传感器路线也依然会是特斯拉的竞争优势所在。

 

5. 为什么帖子数据与舆情分析不再更新了?

   我认为当前赛力斯发展的主要矛盾与股价的主要影响因素都不再是当前车型的口碑与销量。既然如此,每周的帖子数据分析意义不大。等到车型的口碑与销量再次成为影响股价的重要因素时,我会再回来发布数据的。在此之前如果有朋友依然对数据感兴趣,也可以联系我获取每周的数据。

 

6. 最近其他文章为什么也不写了?

   1)马上博士毕业了,比较忙。2)在酝酿一次转型。年初我转变了投资体系和模式,经过半年的探索,自认为已有小成。认识我的朋友应该知道,虽然很久没发文章,但是我每天的研究与操作都是高强度的,今年以来效果也相当不错,近来体系日益成熟,自认为已经形成了一套系统。等我准备好之后会开始公开分享。


            同步雪球号:熊熊投研

同步公众号:老陈的锅

感谢阅读!欢迎在评论区或公众号后台评论留言!


例行申明

1) 本文为个人文学笔记,内容均不构成投资建议或投资顾问服务。本人没有证券从业资格或投资顾问资质,本人、本号、本文不诊股,不荐股。文章提及的上市公司以及相关介绍分析均作为个人投资思考感悟的记录、分享,仅供阅读,不作为交易参考。

2)股市有风险,入市需谨慎。股票投资者应具备基本的股票交易和投资知识以及独立思考决策能力,自主操作,自负盈亏,切勿根据本文内容交易股票。

3) 本人为中长线基本面投资践行者,专注于上市公司基本面的挖掘跟踪以及基于基本面的价值分析,不会看K线图,不会分析股票或市场的短期走势。

4) 本人不是金融业专业人士,文章中的用语、分析有不当之处,敬请谅解,欢迎在评论区或公众号后台留言指正。也欢迎在评论区或后台向本人分享您感兴趣的股票或投资话题。

 

作者在2023-06-27 16:55:02修改文章
作者利益披露:原创,不作为证券推荐或投资建议,截至发文时,作者不持有相关标的。
声明:文章观点来自网友,仅为作者个人研究意见,不代表韭研公社观点及立场,站内所有文章均不构成投资建议,请投资者注意风险,独立审慎决策。
S
赛力斯
S
理想汽车-W
S
蔚来-SW
S
小鹏汽车-W
工分
7.76
转发
收藏
投诉
复制链接
分享到微信
有用 3
打赏作者
无用
真知无价,用钱说话
0个人打赏
同时转发
暂无数据