登录注册
三六零董事长周鸿祎在AI峰会上的演讲
金融民工1990
长线持有
2023-05-11 22:13:46

TMT电子】20230510三六零董事长周鸿祎在AI峰会上的演讲

本来我是准备了一个演讲稿的,想跟大家分享一下我对人工智能的理解,就像刚才胡又文讲的一样,为什么这是一场工业革命?包括这个和原来的人工智能有什么不一样?

大家都知道,我现在人称“红衣大叔”,原来人称“红衣大炮”,我不喷人已经很久了。但是最近有人老在喷我,为什么呢?因为我说了一句大实话,就是中国到底该怎么样做自己的GPT?我的一个观点是既不悲观,也不要过于速胜,因为GPT的成功用到了很多开源的技术、公开的算法,包括别人已经把路趟出来了,技术路线也差不多确定了,剩下的是很多工程化预训练数据的筛选和准备,比如说用户监督学习答案和问题的标注和改进。应该来讲,中国自己做GPT的难度肯定比光刻机的难度要低了很多,刚才胡又文也讲到本质还是软件。另外再加上最近国际上开源的东西特别多,开源给了我们很多快速学习和吸收别人经验的机会,而且不用重复发明轮子。

中国这么多公司大家没有躺平,这么多互联网公司跟打了鸡血一样的大练大模型,我觉得还是很有信心的。包括最近4月份,大家看到很多友商都陆陆续续发布了自己的演示版,我觉得还是非常令人惊喜。但是另一方面如果有人天天胡说,说我们跟OpenAI的差距就差两个月,你们相信吗?如果你们要信我也就跟着信,反正我是不信。

中国目前发布的模型虽然说算法都差不多,模型也都基于很多开源的东西来改造的,说句实话,但是因为这种预训练数据和用户监督学习问题标注的不一样,从目前我看到的演示来说,说句得罪所有同行的话,我觉得跟OpenAI都有比较大的差距,如果OpenAI是100分的话,我觉得目前国内的水平也就是几个水平六七十分,大概都差不多。

我们整个行业大概跟OpenAI的差距大概在两年左右,我说的这个话已经很保守了,两年左右的时间去趟很多的坑,还要改进,OpenAI还要不断地进步,如果你真的认真用OpenAI ChatGPT4.0,包括看看微软的135页对于ChatGPT4.0的深入分享,你再看看国内做的题目,这个还是有差距的。

但是我也不知道国内有哪些人喜欢喷我,说我在造概念车,他们说的话你们也就信,他们说我们跟OpenAI差6个月,大家一算周鸿祎说差两年,张三说差6个月,张三比周鸿祎领先一年半。

我今天就不想演讲了,我就把本来是下个月要发布的功能,今天在这儿挑几个问题预发布一下。我理解为什么有的公司会愿意录视频来做演示?我也很想录视频做演示,因为生成式AI特别不稳定,所以这个结果可能有好有坏,但是骡子是马,我们拉出来溜溜。我知道很多券商手里有一本习题集,我们可以拿这些题来试一下。

提问:星舰发射成功了没?

 

提问:根据一则新闻,回答星舰发射是否成功

 

扮演一名“喷子”对星舰进行批评

 

吹捧一下星舰

 

 

提问:人生中该明白的十个道理是什么?

 

续写《红楼梦》中林黛玉倒拔垂杨柳的故事

 

我的演示占了我主要的时间,但是今天也给大家自报其短,我们的数学能力训练刚刚开始,所以我们今天基本上没有演示鸡兔同笼的问题,就跟小孩子做奥数一样,只要有足够多的例题,所谓的解题能力很快的就能增长上。

最后我说两个观点分享一下,刚才胡又文讲到这是一场工业革命,我想说说为什么它是工业革命的感觉?在大语言模型出来之前,大家仔细想想人工智能其实离很多企业非常遥远,比如说你是做钢铁的,他是做化工的,我是做餐饮的,甚至包括很多IT企业,大家提起人工智能,就会觉得我要解决的问题特别长尾、特别碎片,解决每一个问题我要采集不同的数据,我要做不同的训练,要建立不同的模型,所以这就是为什么人工智能这个概念说了很久,它没有变成一场真正的工业革命。历史上所有的工业革命都是能够对各个行业不加区分的进行赋能,就像当年个人电脑在出来之前,其实有很多专用计算机,比如说给气象研究的,给大气物理研究的,给核武器研究的,但是它跟普通人没有关系,跟普通每一个企业没有关系,再高精尖的技术也无法形成工业革命。所以这次我认为GPT最了不起的是解决了这个问题,你用大数据预训练把它训练成一个大模型,这个大模型出来之后本身对企业的很多日常管理、办公、经营工作就能直接进行赋能,直接就能够从企业里面的领导到每个员工都能够感受到GPT解决你的一些痛点和刚需。

为什么讲它是一个AGI,是一个通用人工智能?从产业的角度来讲,正因为它通用,每个行业都会有机会直接被它能够加强。这才是工业革命的基础。我最近拜访了很多城市,我跟很多城市主管做一个交流,很多城市在搞智慧政府、智慧城市,很多数字都在消灭数据孤岛、数据烟囱,但是当真的当很多城市积累了很多大数据之后,这个大数据真的发挥了作用吗?如果你是一个企业的领导,你扪心自问,就算你的企业积累了一些大数据,真的发挥作用了吗?很多大数据要发挥作用还需要进行复杂的应用开发,甚至要有一个强大的数据中台,要对数据进行不同的清洗、整理、分类,最后才能够把所谓大数据的作用能够和某一个应用场景结合起来。

从这点来讲,大数据不是数字化的终点,大模型通用的人工智能才有可能形成数字化的另外一个高峰,就是真正的智能化。包括很多城市搞了超算中心,大家想想过去它真的发挥作用了吗?不同行业的企业如果去超算中心、去大数据交易所,它的需求是完全不一样的,但是今天大模型给了我们一种可能,不论你有什么样的大数据,可以无标注的直接训练到大模型里面去。出来的大模型能力却是通用的,即使是某些城市、某些企业有对自己私有部署大模型的需要,也是在一个通用的大数据训练出来的大模型之上,再加上一些专有数据增强的训练。

这是我的第一个感觉,现在很多企业和城市有了自己的大数据之后,离人工智能我觉得就差大模型来补上这个环节。第二个,昨天有人在网上讲了一个概念,中国原来叫千团大战,现在叫千模大战或者万模大战,这个道理很简单,我在几个月之前也讲过,感谢开源,感谢开放,感谢技术的传播,大模型技术已经不是当年曼哈顿计划的原子弹了,由于有了开源,基本上今天是一个IT公司很多训练的方法也是公开的。

大模型既然这个武器已经扩散了,最后谁会胜出呢?我不能下这个结论,但是我给大家说一个观点,如果目前大模型的能力都是七八十分、六七十分,都差不多,没有谁会遥遥领先,像OpenAI那样一统江湖,最后是谁的场景多、谁的用户多,谁就会在这个大模型之战中占有一个有利的位置。

比如说阿里的张勇说阿里所有的PPT全家桶都要赋能,包括像钉钉有很多的用户群,头条肯定是把抖音、飞书常见的入口都加上大模型的智能能力,百度毫不犹豫的肯定要在搜索,甚至在手机百度上要进行集成,最不慌的为什么是腾讯?腾讯到今天都还没有急着推出,谁推出大模型都要做个机器人放在微信里。360的两个入口:搜索、浏览器,我们搜索的日均需求超过了10亿次,浏览器平均的MAU(月度活跃用户数)超过4个亿。这个考验的是大家训练的数据、训练的方法,这个不会有一个一招鲜的东西,一夜之间就把你从70分提到90分,包括OpenAI自己训练GPT4也训练了很长的时间,这里面有很多坑还等着大家去踩。

360提的两翼齐飞的策略,一定要抢占场景,没有场景的公司在大模型未来的竞争会遇到很大的挑战,大家都知道大模型等于是大的算法、大的算力+大的数据+大的标注,其实不要忘了还得有一个大的流量,包括OpenAI和微软的合作,微软给它带来了巨大的真实的反馈,才能知道说数以上亿计用户的反馈要求,才能帮我们收集数据,能够更好的改进。

像刚才我做的这种题目,就是给大家展示一些能力而已,每家都能找到对自己比较擅长的作题,我做黄冈的卷子是90分,那一家做衡水中学的卷子就得了80分,但是最后还是要让老百姓来出题,老百姓出题的题目就可能有数以万计的情况,很难下一个结论。要把大模型做好,我的感觉是一定要有场景,要有丰富的用户使用反馈。在这方面,360还是非常有信心的。

上一次我也是在一次发布会上展示了我们360跟搜索的结合,还是一个月之前,大家可以看到这一个月内多轮对话的能力、生成的能力有了很大的提升,所以我还是坚定的相信我们跟国际的水平现在是看得见的差距大概就一年半到两年,只要中国坚持长期主义,不要想着盲目的乐观速胜,但也不是悲观说完全做不出来,我觉得最终中国会探索出一条自己的GPT之路。而且中国也不会像美国那样有一个大的ChatGPT大家都基于它服务了,我觉得中国互联网公司里面的第一线队伍和第二线队伍都会打造自己核心的GPT技术,而且未来中国大一点的企业和每个政府,包括每个城市都会有自己专有的GPT。

很简单,第一个,很多政府或者城市、企业,包括我们也都遇到类似的问题,你去用ChatGPT,你不是把它简单的当搜索在用,不是简单的提一个关键词,它就给你完美的答案,你看到了你需要给它多轮的交互,需要给它很多背景知识,你要把你现在做的工作都告诉它,这里面就存在数据泄露的问题,对中国大型国企和政府部门来说,这点是不可接受的。第二个,大家觉得现在GPT已经很能干了,但是你仔细的想想它依然是个通才,还不是一个专才,很多企业和政府在多年的工作中积累了很多专有的知识,就是我们独有的所说的我对这个行业的knowhow,这是企业核心的竞争力,你愿意把你的Knowhow拿出来,所有的同行都能用你的Knowhow,所以能够对外分享的都不是真正的秘密。

很多企业会有这样的一个需求,比如说360干了很多年的安全,我们在安全上有非常多的攻击样本的积累、攻击知识的分析,我有一个专有的GPT大脑把这些知识训练进去,在内部就会成为我非常强的助手,这些GPT就会支持我的内部,支持我的客户。中国未来GPT的市场不要只盯着OpenAI这一个例子,中小企业可能会接受利用开放的API,以SaaS化的模式接受各种应用。但是中国的很多政府、城市,还有很多大中型企业未来可能都会需要自己私有部署、私有训练,包括私有数据的GPT大脑。

最后也补充一点,原来有很多公司做这个模式,有人也问我说做得并不成功,说我上来就给金融训练一个人工智能的客服,我给某个行业训练一个人工智能的大脑,为什么不成功呢?等于这个模型不够大,没有做通识的教育训练,相当于你直接把一个文盲请到企业里面让他学习企业的专业知识,效果肯定不会特别好。今天我们讲了即使是专有的GPT,首先要在互联网上用通用的知识经过训练,用通用的用户的反馈来对它进行提升,至少训练出一个大学本科或者研究生的水平,再把它放到城市、政府、企业里面,再去让它学习专有的知识,这个效果会提升的非常快。


作者利益披露:转载,不作为证券推荐或投资建议,旨在提供更多信息,作者不保证其内容准确性。
声明:文章观点来自网友,仅为作者个人研究意见,不代表韭研公社观点及立场,站内所有文章均不构成投资建议,请投资者注意风险,独立审慎决策。
S
三六零
工分
4.16
转发
收藏
投诉
复制链接
分享到微信
有用 2
打赏作者
无用
真知无价,用钱说话
0个人打赏
同时转发
暂无数据