登录注册
ChatGPT 浪潮下互联网大厂有何进展 20230207
心无股
2023-02-07 16:07:54
【国内互联网大厂进度】
百度:1)百度布局较早,有自主研发的深度学习平台 ,有文心大模型,在预训练大模型方面有不错的积累,在 AI 发展方面把握先机。百度的文心大模型具备多功能,可以进行文本生成,内容提取,摘要生成,观点归纳、图片绘画等。和GPT 很像。2)一般情况下 ,AIGC 优先考虑To B,再考虑丁oC。因为ToB的商业群体比较稳定,付费意愿也比较稳定。百度计划同时推出 丁o B和下。C的产品,并先发布丁oC的demo。
字节:已经开始布局,主要是 AI+内容。比如自动生成投稿和辅助写作,在今日头条上利用 AIGC 生产内容。目前 AIGC 整体的生成质量的内容还是较好的 ,要好于普通的UGC,但和 PGC 相比还有所欠缺。抖音方面也有应用,通过 AI 的模式来生成短视频,比如一些图文类的短视频的。
阿里、京东等电商类平台:在智能客服领域有布局 ,其次是 AI+营销,例如阿里巴巴,可以结合商品,自动生成高质量文案描述商品,提高营销效率。
腾讯:以广告为主 ,支持广告智能制作,以 AIGC 技术生成广告文案和视频,降低了制作成本,目前市场规模快速增长,未来5 年内 AIGC 产生的图片的占比预计会达到 10-30%。前期可作为 UGC 和 PGC 的辅助,帮助广告主设计文案。到后期就是 AI 技术整体的发展,后期可能是有望代替人工的工作。
[QA)
Q:百度 ToC 产品的进度如何,使用体验如何?
A:1)百度有文心大模型的基础,去年 ChatGPT 刚发布后,他们基于对话的语料,做了一个类似的新模型 ,是多轮对话的模型和百度搜索引擎相结合一一用户问一个问题,AI会给一个答案,同时搜索引擎会基于这个问题做一些相关的补充,比如答案的来源和链接。
2)如果和搜索引(擎结合起来后,整体使用效果还是可以的 ,因为结合后,不涉及到特别多轮对话,一般我问一句,它回一句,就结束了。至于多轮对话容易遗忘的问题 ,可能需要在后续的优化过程中,重点考虑怎么捕捉更远的信息,怎么捕捉用户长期讲话的意图。
Q:ChatGPT 会替代传统搜索引擎嘛?
A:1)短期内不太可能取代传统的搜索引擎,ChatGPT 会给出一些看似有道理但实际是错误的回答,可信度不是很高。
2)ChatGPT对于新数据不太友好 ,未能建立和实时信息的连接,目前预训练模型如何保持实时更新,是一个大问题。
3)ChatGPT 的训练成本很高,付费过多 ,可能用户放弃使用 ;但不付费,成本压力过大 ,长期可能在训练成本或者推理成本上都做了比较多的优化以后,再看对搜索引擎的替代。
4)可能短期内还不能替代,但长期不好说。至少可以跟百度的模式一样,搞双引擎的模式。
2:除了百度外,国内还有其他公司可以推出类似的产品嘛?国内其他大厂,比如腾讯、字节等,会想着在短时间内做出来类似 ChatGPT的产品吗,抢占先机,形成类似微软对谷歌的卡位?
A:1)我觉得小公司机会比较小,这是一个技术积累的工作,需要有数据训练的基础和经验,需要资源和人力的投入。小厂很难做出来,因为成本太高了。小厂更适合去接入这些大厂的模型,成为大厂的客户,然后做
这些模型的应用,比如 AI绘画等,对接C端消费者。
2)国内的大厂比如字节、腾讯、阿里有机会。
宇节已经开始在做语言处理模型,目前在数据和算法方面的积累都不差,字节其实也要发大力发展搜索,包括培养用户的搜索心智。字节也希望推出新的产品,从而抢占先机,实现它在搜素领域的一个超车。目前字节还处于大模型的训练和调试状态 ,没有产品的具体规划。但如果能做出来,还是对字节搜索领域的地位有积极影响 ,我认为字节跟百度在搜索领域,会有很多的交叉的冲突,也一直在大力发展搜索领域,所以是有可能做出类似的产品。
Q:国内会引入 ChatGFT 嘛(考虑到有一些内容指向性的问题)?如果Bing 引入了 chatGPT 对于中国搜素市场的影响?
A:1)ChatGPT 目前会有一些伦理层面的问题,目前国内的监管政策还不是很全面 相关的法律法规还没有健全 还有很多这种一些细节的东西,短期内我们的规章制度其实也没有覆盖到。
2)总的来说 ,我认为 ChatGPT 的To B端可能会引入,国内的小公司可以应用,目ChatGPT 的To B端因为成本、优化等问题还没有开放,如果 ChatGPT 的丁o B端开放,国内的一些小型创业公司可能会接入,并去做下游应用端的产品。未来接入微软的 Bing 后,其实对搜索是会有一定的冲击的,首先我们考虑一下用户的猎奇心理,肯定会有大量的用户愿意去用,能够产生大量DAU,如果效果是比较好,这些用户是愿意留下来继续使用它的,久而久之其实是会改变到用户的搜索习惯。
Q:字节内部目前在类 chatGPT 产品方面的规划?
A:从我们看字节对搜素的重视程度,搜索现在也是一级部门,对搜索的重视程度很高,因为搜索在现在在抖音、今日头条的重要性上很高,本次也是集合了几个核心的部门,组成小团队来做模型。目前来说可能还没有产品的计划 ,星然是比百度晚一些 ,但后续要看产品的效果和用户的体验先发后发的影响不是很大,需要看后续的发展。
Q:谷歌最近在财报上说,他们的LaMDA 模型可能在近期推出类似ChatGPT 的功能,如何看待谷歌在语言模型方面的积累?
A:1)谷歌的技术积累很不错,团队都非常优秀,模型积累很好。
2)数据方面,谷歌天然就有很多搜奈引擎的数据,算力方面也不用担心,很多技术都是谷歌推行的。相对来说 谷歌研发类似产品的可行性非常大,而且成功概率非常高。而且它的效果也是值得我们期待的。如果效果比ChatGFT好的话,那也算一种后发优势。
Q:如果未来出现很多的模型 ,这些模型都基于差不多的数据去训练出来的,,又有很多应用去基于这些模型去开发不同领域的垂直应用。整个环节的价值量最大的地方会不会在公有云跟硬件厂商。因为最后有可能模型会趋于雷同,甚至很多应用程序会被迅速的抄袭,迅速的雷同化?
A:1)他们肯定是受益者,但这种说法有一个前提,算法是有上限的。但是实际来看 ,各家公司的算法上限不同,不同的公司,它掌握的能力不一样,算法还是有很大的提升空间,我认为不会在短期内趋于雷同。模型的发展的效果。可能是越来越往上的。
2)发展的模式也有区别。可能会有一批大的公司搞基础性的模型,比方类似于 GPT 这种模型,其实 ChatGPT,它也是GPT-3.5的版本上,做了一些微调而做的产品。还有公司做应 用层面/垂直赛道的小模型开发。未来是两种发展模式相结合。
2:字节和百度在该方向的算力、数据和人员投入如何?
A:1)国内大厂的算力基础都不差。在模型方面,字节在推荐领域也已经有千亿参数的大模型,只是说在应用的领域不同。百度有文心大模型作为基础。
2)数据方面,字节也有一些头条和抖音的搜索数据,量级上没有百度搜素的数据量大。从投入来看,其实两个公司的投入都非常大。百度把 AIGC 作为一个发展浪潮来追赶的,而且搜索是它非常核心的业务场景,所以百度的投入是很大的 ,而字节,其实切入的稍微有点晚,没有百度那么快。字节把几个最重要的核心部门 联合起来成立专项团队。其实整体上来说投入也还可以。
4)所以综合比较,在算力和数据上 ,字节跟百度的区别可能没有那么大。但在人力投入上 ,因为搜索是百度的核心业务,百度的整体的投入可能会比字节更大一些。
2:现在 ChatGPT 没有对国内开放,国内厂商在中文的领域,相比海外厂商,在用户体验上能形成一定的或者明品的优势?
A:我认为语言不是大的壁垒,我认为短期内,ChatGPT 没有向我们大陆开放,我们国内其实是有机会这样做出来产品的,但是想要超越
ChatGPT 的可能性会非常低。因为像一些我们的头部大公司,目前来说也还没有推出一款产品,能够跟 ChatGPT 的模型的效果能够PK,所以可能短期来看我觉得不大能够超过它。但是我们短期来看,我们可以通过这样的一个时间窗口,我们可以做逼近它的效果,是国内公司比较好的状态
&:腾讯和阿里在 AIGC 方面的布局如何?
A:1)腾讯和阿里的搜索业务弱一些,不是重点,例如阿里,主要聚焦于电商领域,所以他可能在 ChatGPT 上不会有很多布局,目前阿里主要的发力方向是利用 AIGC 去做 AI+营销,比如赋能商品的文案撰写等,未来阿里可能会继续往这个方向布局。
2)腾讯可能在广告、社交、游戏等领域应用 AIGC 技术。比方塑造更广义的互动叙事的品类 ,带来一些新的社交的玩法和商业模式的新的启发等等。总的来说,AIGC 是一波技术浪潮。国内的大厂的看法是要和现有的业务结合起来,实现自身业务更好地发展。而不是只关注 ChatGFT这一个 AIGC 的细分赛道。
Q:可以大概理解成,腾讯和阿里更偏向应用端吗,未来腾讯和阿里的大模型会自研吗?
A:我认为腾讯和阿里的大模型是会有自研的趋势的。像这种大公司,它对专利,包括一些专业的技术积累其实还是比较有讲究的。所以我觉得长期来看,大厂大模型会自研。
&:如果大模型投入使用,对于算力等基础设施的需求会不会是指数级的提升?
A:我认为是的,ChatGPT 刚发布的时候,就因为用户访问量过大,算力不足而出现问题。随着用户量级的大规模的上涨,算力的需求确实会呈现一个指数级的上涨。至少是非常正相关的,因此推理和训练的资源的开销肯定是非常大的。所以这一块也是优化的重点,就是怎么去让资源尽可能地节省,让整体的一个性能更好地提升。
Q:除了 GPU,芯片方面还有可以替代的产品吗?
A:1)自研芯片 ,但是目前整体来说目前还没有看到特别好的一个产品。
2)采用分布式的CPU,性能上差一些,但是成本便宜 ,很适合做推荐算法模型的公司,比如抖音、快手、Tiktok 等,都是采用分布式的 CPU 做大模型的基础算力设施。
Q:如何去辨别海内外厂商大模型的优劣?
A:如果我们要评价它的具体的效果,最直接的是人工测评,看下真实的感受和评分。专业角度来讲,我们可以用测试集,分别请求这些模型的API,基于一些评价指标,去看这些模型的表现如何。模型的参数、训练数据可以作为参考的指标。它的模型的参数量级更大 ,理论上模型的效果应该会更好 ,但相对片面一些,还是要实际测试和感受后才知道。
Q:应用场景的数据,在中国来讲是不是一种比较紧缺的资源。如果是要把模型训练好,可能非常依赖这些产业厂商的合作?
A:1)特定领域的数据是比较稀缺的,比如医疗、司法等领域,所以可能会生成类似的商业模式。
2)可能最后就会形成这种商业模式:大公司负责训练大的基础模型,其他的一些创业型的公司或者一些小公司 ,在大模型的基础上 ,加上他们自己特定领域的一些数据集,得到这种新的领域式的模型 ,来服务于他们自己的一些商业化的计划。
3)这种模式下,大厂有钱赚,对于小厂来说,它既能保护到自己的数据的隐私,同时也能够形成这样自己的领域类的商业化的路径。
声明:文章观点来自网友,仅为作者个人研究意见,不代表韭研公社观点及立场,站内所有文章均不构成投资建议,请投资者注意风险,独立审慎决策。
S
百度集团-SW
S
视觉中国
S
神思电子
S
奥飞数据
工分
8.19
转发
收藏
投诉
复制链接
分享到微信
有用 4
打赏作者
无用
真知无价,用钱说话
0个人打赏
同时转发
评论(2)
只看楼主
热度排序
最新发布
最新互动
  • 1
前往