【申万宏源】特斯拉Optimus视频，算法&控制进步显著，大模型数个阵营形成中！-韭研公社

登录注册

【申万宏源】特斯拉Optimus视频，算法&控制进步显著，大模型数个阵营形成中！

戈壁淘金

只买龙头的老司机

2023-09-25 08:00:48

✔官方推特：特斯拉Optimus可以自主排序对象，神经网络完全端到端训练，视频输入、控制输出。
✔视频中Optimus进步：
1、Optimus可以基于纯视觉和关节位置编码器，自我校准双手、手臂和腿，可以在空间中精准定位四肢；
2、学习复杂多任务的效率更高，深度学习神经网络完全基于控制器和纯视觉感知。比如，排序分类（对方块按照颜色进行分类）；处理动态变化（在人员干扰下不受影响）；自主纠正（将方块放正）；并训练更多任务；
3、姿态控制和自平衡能力：机器人在视频里实现拉伸、伸展全身、单腿站立平衡等高难度动作，运动控制能力进一步增强。

✔本次硬件层面变化不大，进步主要在算法：
1）机器人训练模型为端到端模型，并非最新，但是Tesla新亮点，与微软、谷歌RT2、李飞飞、mata等多模态大模型算法类似（视觉语言动作一体化，尤其谷歌的VLA），大幅提升机器人学习效率；
2）纯视觉+控制器+编码器，让机器人对四肢更加精准的定位和控制；
3）全身平衡和姿态控制能力强，控制十分精准，可以将重心控制在很小的区域。
4）国外已经形成3-4个大模型场景阵营，国内也在飞速形成。
a）Google+deepmind：大模型（gemini，多模)-> 算力（TPUV5，DSA）->硬件场景（机器人，palm-e)->软件场景（BARD+谷歌云等）
B) Tesla:大模型（尤其BEV+占用网络）->算力（DOJO+FSD,DSA）->硬件场景（智驾+机器人）->软件场景（暂封闭，FSD软件）
C) 微软+openAI:大模型（gpt4,gpt5，多模）->算力（买NV等）->硬件场景（暂封闭）->软件场景（copilot，office全家桶）
D)Meta:大模型（llama2，未来新模型）->算力（计划自建）->硬件场景（暂封闭)->软件场景（SAM, dinov2，XR等）
E)国内华为链、特斯拉链、英伟达+AMD链等也在快速形成，军备竞赛促成最强景气

受益环节：视觉、编码器、IMU、运动控制器等传感器，国内总成、减速机、电机等硬件供应商受益于产业发展

标的：
A)解耦算法：柏楚电子（机械)/虹软科技
B)耦合机器人：萤石网络(tmt&家电家居）/德赛西威/中控/步科
C)解耦制造：立讯（电子）/鸣志电器（机械）/双环（机械&汽车）/科博达（汽车）

作者利益披露：转载，不作为证券推荐或投资建议，旨在提供更多信息，作者不保证其内容准确性。

声明：文章观点来自网友，仅为作者个人研究意见，不代表韭研公社观点及立场，站内所有文章均不构成投资建议，请投资者注意风险，独立审慎决策。

虹软科技

步科股份

科博达

鸣志电器

工分