【申万宏源tmt-计算机】DINOv2的三大启发:数据+进步+开放+中国优势场景!
🔥Meta再发DINOv2,在CV领域,DINOv2更是SOTA(当前最佳)级别的模型。能在深度估计、语义分割、图像相似性比较等方面实现自监督训练。
#来源是:DINOv2: Learning Robust Visual Features without Supervision
https://arxiv.org/abs/2304.07193
#代码是:https://github.com/amusi/CVPR2023-Papers-with-Code
🔥亮点有:
1)自监督学习视觉大模型。不仅会分割,而且会找图像特征。
2)表现上已经与经过弱监督学习的模型性能相当。
3)语义分割、实例分割、深度估计和图像检索等任务都擅长。
4)训练vit模型,并将其提取为较小的模型,这些模型在图像和像素级都超过了可用的最佳通用功能OpenCLIP(Ilharco等,2021)
注:即蒸馏。而剪枝、量化和蒸馏是常见压缩模型方法。
🔥隐含逻辑:
1)再次证明数据场景核心。10亿ViT架构,但DINOv2数据集(相似图片)精心挑选。
2)meta真心力争开放,例如LLaMA,SAM,DINOv2。
3)直接开始赋能部分场景,DINOv2还能被用于改善医学成像、粮食作物生长等
🔥有幸在市场率先指出计算机遍地黄金/aigc重大机会,也指出aigc2.0阶段,收缩到“格局型”标的,cv恰好是国内aigc优势领域,多模态/sam/dinov2等都是证明,这也是适合中国国情+容易落地的大模型,国内可能采用大小模型结合的视觉大模型,迎接gpt4和5!
🔥相关标的:
hkws,大华股份,虹软科技,千方科技,万兴科技,关注当虹科技
【申万宏源tmt-计算机】