登录注册
为什么说多模态里当虹科技类似年初AI第一波里的海天瑞声
瑟德
一卖就涨的老司机
2023-12-11 12:33:09
当虹科技最早写过一次,基本面的东西就不多赘述

本文只是从AI进展的角度聊一聊,皆为个人思考,并非什么专业建议。

核心结论就是一个类比:

-人类=人眼所见——大脑理解处理——给出反射执行

-多模态=AI看见(视频)——数据处理(理解视频里的数据)——执行反馈。

即核心就是理解AI看到的画面,重点是视频内的数据处理。

-多模态AI相比之前的chatgpt,是AI从认识文字到认识世界(通过视频)的一个进化过程;

-如果chagpt说是AI初中生,那未来成熟的多模态,就是AI的成年人形态;

GPT对应0-1,多模态对应1-10.

——————————————————————————

-如何更好的让AI理解看到的东西,决定了多模态的高度。(谷歌自己都说了,放出的视频里Gemini需要人为提示词来加强理解)

-而688039当虹科技的主营,正好是视觉多模态内容的处理分析:

2023年半年报:公司视觉多模态分析技术基于自主研发视觉多模态分析技术,对多媒体进行视频、语音、文本、图像等内容的多维分析,针对视频中出现的内容进行多模态融合的智能理解分析并进行结构化标签提取,包含视频中出现的人物、车、物体、地标建筑、文字等内容的识别。


-同时视频内容数据量大是一个特别,因此压缩处理也十分关键:

当虹科技:公司拥有自研的AIGC工具集,于今年上半年发布了以静态照片生成三维体积视频的方案,支持6DOF(六自由度)视角自由移动,并且通过点云模型转换及压缩算法实现高达800倍的视觉无损压缩

 

反正我觉得很硬~ 和当时海天瑞声的数据集用于训练逻辑类似:

视觉多模态数据分析处理是多模态的关键核心所在。


作者利益披露:原创,不作为证券推荐或投资建议,截至发文时,作者不持有相关标的。
声明:文章观点来自网友,仅为作者个人研究意见,不代表韭研公社观点及立场,站内所有文章均不构成投资建议,请投资者注意风险,独立审慎决策。
S
当虹科技
S
苏州科达
工分
26.42
转发
收藏
投诉
复制链接
分享到微信
有用 36
打赏作者
无用
真知无价,用钱说话
0个人打赏
同时转发
评论(15)
只看楼主
热度排序
最新发布
最新互动
  • 只看TA
    2023-12-11 20:53
    没有比这个硬的逻辑,明天爆发!超过万兴科技涨幅!
    1
    0
    打赏
    回复
    投诉
  • 只看TA
    2023-12-11 17:39
    拓尔思如何?
    1
    0
    打赏
    回复
    投诉
  • 只看TA
    2023-12-11 12:43
    硬!
    1
    0
    打赏
    回复
    投诉
  • 只看TA
    2023-12-11 12:38
    1
    0
    打赏
    回复
    投诉
  • 只看TA
    2023-12-11 17:36
    感谢分享
    0
    0
    打赏
    回复
    投诉
  • 只看TA
    2023-12-11 15:00
    除了他还有谁?干不了科创
    0
    0
    打赏
    回复
    投诉
  • 加油奥利给
    下海干活的韭菜种子
    只看TA
    2023-12-11 12:53
    0
    0
    打赏
    回复
    投诉
  • 不绝
    孤独求败的小韭菜
    只看TA
    2023-12-11 12:45
    多模态 这个肯定绕不过去
    0
    0
    打赏
    回复
    投诉
  • 只看TA
    2023-12-11 12:43
    感谢分享
    0
    0
    打赏
    回复
    投诉
  • 只看TA
    2023-12-11 12:43
    下午冲
    0
    0
    打赏
    回复
    投诉
  • 1
  • 2
前往