登录注册
SAM之后Me­ta在机器视觉领域又放核爆!小扎高调官宣DI­N­Ov2
AI挖啊挖
2023-04-19 08:28:55


【国盛计算机】多模态GPT,朝着科幻前进
继零样本分割一切的SAM,Me­ta又迅速开源DI­N­Ov2模型,DE­MO网址:网页链接
DI­N­Ov2 能产生高性能的视觉特征,用于不同下游视觉任务如分类、分割、图像检索和深度估计,不需要微调。
其创新点和优秀性能来源于使用图像自监督学习的方式训练,不需要图像和文本对应的训练数据,克服了文本对图像描述不够全面的局限性。
DI­N­Ov2蒸馏成小模型后效果依然优秀,能在大部分测试基准超过之前最好的模型Op­e­n­C­L­IP。Me­ta表示正计划将DI­N­Ov2集成到更大的人工智能系统中,提供丰富图像特征与大语言模型交互。
影响:1)不需要微调即可胜任玩成图生文前期任务,提升整个方案的泛化能力,为后续识别的泛化能力提高打下基础。2)能蒸馏成小模型,便于在各种边缘场景及本地话落地。3)为大语言模型提供图像特征,加速多模态人工智能的发展。
朝着科幻前进。预计1~5年内,随着多模态的发展带来AI泛化能力提升,通用视觉、通用机械臂、通用通用物流搬运机器人、行业服务机器人、真正的智能家居会进入生活。预计5~10年内,结合复杂多模态方案的大模型有望具备完备的与世界交互的能力,在通用机器人、虚拟现实等领域得到应用。
相关标的:大华股份、海康威视、云从科技、千方科技、商汤科技、萤石网络等及算力产业链公司。

作者利益披露:转载,不作为证券推荐或投资建议,旨在提供更多信息,作者不保证其内容准确性。
声明:文章观点来自网友,仅为作者个人研究意见,不代表韭研公社观点及立场,站内所有文章均不构成投资建议,请投资者注意风险,独立审慎决策。
S
大华股份
S
海康威视
S
千方科技
工分
4.36
转发
收藏
投诉
复制链接
分享到微信
有用 3
打赏作者
无用
真知无价,用钱说话
0个人打赏
同时转发
评论(4)
只看楼主
热度排序
最新发布
最新互动
  • 1
前往