✔官方推特:特斯拉Optimus可以自主排序对象,神经网络完全端到端训练,视频输入、控制输出。
✔视频中Optimus进步:
1、Optimus可以基于纯视觉和关节位置编码器,自我校准双手、手臂和腿,可以在空间中精准定位四肢;
2、学习复杂多任务的效率更高,深度学习神经网络完全基于控制器和纯视觉感知。比如,排序分类(对方块按照颜色进行分类);处理动态变化(在人员干扰下不受影响);自主纠正(将方块放正);并训练更多任务;
3、姿态控制和自平衡能力:机器人在视频里实现拉伸、伸展全身、单腿站立平衡等高难度动作,运动控制能力进一步增强。
✔本次硬件层面变化不大,进步主要在算法:
1)机器人训练模型为端到端模型,并非最新,但是Tesla新亮点,与微软、谷歌RT2、李飞飞、mata等多模态大模型算法类似(视觉 语言 动作一体化,尤其谷歌的VLA),大幅提升机器人学习效率;
2)纯视觉+控制器+编码器,让机器人对四肢更加精准的定位和控制;
3)全身平衡和姿态控制能力强,控制十分精准,可以将重心控制在很小的区域。
4)国外已经形成3-4个大模型场景阵营,国内也在飞速形成。
a)Google+deepmind:大模型(gemini,多模)-> 算力(TPUV5,DSA)->硬件场景(机器人,palm-e)->软件场景(BARD+谷歌云等)
B) Tesla:大模型(尤其BEV+占用网络)->算力(DOJO+FSD,DSA)->硬件场景(智驾+机器人)->软件场景(暂封闭,FSD软件)
C) 微软+openAI:大模型(gpt4,gpt5,多模)->算力(买NV等)->硬件场景(暂封闭)->软件场景(copilot,office全家桶)
D)Meta:大模型(llama2,未来新模型)->算力(计划自建)->硬件场景(暂封闭)->软件场景(SAM, dinov2,XR等)
E)国内华为链、特斯拉链、英伟达+AMD链等也在快速形成,军备竞赛促成最强景气
受益环节:视觉、编码器、IMU、运动控制器等传感器,国内总成、减速机、电机等硬件供应商受益于产业发展
标的:
A)解耦算法:柏楚电子(机械)/虹软科技
B)耦合机器人:萤石网络(tmt&家电家居)/德赛西威/中控/步科
C)解耦制造:立讯(电子)/鸣志电器(机械)/双环(机械&汽车)/科博达(汽车)