ChatGPT 浪潮下互联网大厂有何进展 20230207-韭研公社

登录注册

ChatGPT 浪潮下互联网大厂有何进展 20230207

心无股

2023-02-07 16:07:54

【国内互联网大厂进度】
百度：1）百度布局较早，有自主研发的深度学习平台，有文心大模型，在预训练大模型方面有不错的积累，在 AI 发展方面把握先机。百度的文心大模型具备多功能，可以进行文本生成，内容提取，摘要生成，观点归纳、图片绘画等。和GPT 很像。2）一般情况下，AIGC 优先考虑To B，再考虑丁oC。因为ToB的商业群体比较稳定，付费意愿也比较稳定。百度计划同时推出丁o B和下。C的产品，并先发布丁oC的demo。
字节：已经开始布局，主要是 AI+内容。比如自动生成投稿和辅助写作，在今日头条上利用 AIGC 生产内容。目前 AIGC 整体的生成质量的内容还是较好的，要好于普通的UGC，但和 PGC 相比还有所欠缺。抖音方面也有应用，通过 AI 的模式来生成短视频，比如一些图文类的短视频的。
阿里、京东等电商类平台：在智能客服领域有布局，其次是 AI+营销，例如阿里巴巴，可以结合商品，自动生成高质量文案描述商品，提高营销效率。
腾讯：以广告为主，支持广告智能制作，以 AIGC 技术生成广告文案和视频，降低了制作成本，目前市场规模快速增长，未来5 年内 AIGC 产生的图片的占比预计会达到 10-30%。前期可作为 UGC 和 PGC 的辅助，帮助广告主设计文案。到后期就是 AI 技术整体的发展，后期可能是有望代替人工的工作。
[QA)
Q：百度 ToC 产品的进度如何，使用体验如何？
A：1）百度有文心大模型的基础，去年 ChatGPT 刚发布后，他们基于对话的语料，做了一个类似的新模型，是多轮对话的模型和百度搜索引擎相结合一一用户问一个问题，AI会给一个答案，同时搜索引擎会基于这个问题做一些相关的补充，比如答案的来源和链接。
2)如果和搜索引(擎结合起来后，整体使用效果还是可以的，因为结合后，不涉及到特别多轮对话，一般我问一句，它回一句，就结束了。至于多轮对话容易遗忘的问题，可能需要在后续的优化过程中，重点考虑怎么捕捉更远的信息，怎么捕捉用户长期讲话的意图。
Q：ChatGPT 会替代传统搜索引擎嘛？
A：1）短期内不太可能取代传统的搜索引擎，ChatGPT 会给出一些看似有道理但实际是错误的回答，可信度不是很高。
2)ChatGPT对于新数据不太友好，未能建立和实时信息的连接，目前预训练模型如何保持实时更新，是一个大问题。
3)ChatGPT 的训练成本很高，付费过多，可能用户放弃使用 ;但不付费，成本压力过大 ,长期可能在训练成本或者推理成本上都做了比较多的优化以后，再看对搜索引擎的替代。
4)可能短期内还不能替代，但长期不好说。至少可以跟百度的模式一样，搞双引擎的模式。
2：除了百度外，国内还有其他公司可以推出类似的产品嘛？国内其他大厂，比如腾讯、字节等，会想着在短时间内做出来类似 ChatGPT的产品吗，抢占先机，形成类似微软对谷歌的卡位？
A：1）我觉得小公司机会比较小，这是一个技术积累的工作，需要有数据训练的基础和经验，需要资源和人力的投入。小厂很难做出来，因为成本太高了。小厂更适合去接入这些大厂的模型，成为大厂的客户，然后做
这些模型的应用，比如 AI绘画等，对接C端消费者。
2)国内的大厂比如字节、腾讯、阿里有机会。
宇节已经开始在做语言处理模型，目前在数据和算法方面的积累都不差，字节其实也要发大力发展搜索，包括培养用户的搜索心智。字节也希望推出新的产品，从而抢占先机，实现它在搜素领域的一个超车。目前字节还处于大模型的训练和调试状态，没有产品的具体规划。但如果能做出来，还是对字节搜索领域的地位有积极影响，我认为字节跟百度在搜索领域，会有很多的交叉的冲突，也一直在大力发展搜索领域，所以是有可能做出类似的产品。
Q：国内会引入 ChatGFT 嘛（考虑到有一些内容指向性的问题）？如果Bing 引入了 chatGPT 对于中国搜素市场的影响？
A：1)ChatGPT 目前会有一些伦理层面的问题，目前国内的监管政策还不是很全面相关的法律法规还没有健全还有很多这种一些细节的东西，短期内我们的规章制度其实也没有覆盖到。
2）总的来说，我认为 ChatGPT 的To B端可能会引入，国内的小公司可以应用，目ChatGPT 的To B端因为成本、优化等问题还没有开放，如果 ChatGPT 的丁o B端开放，国内的一些小型创业公司可能会接入，并去做下游应用端的产品。未来接入微软的 Bing 后，其实对搜索是会有一定的冲击的，首先我们考虑一下用户的猎奇心理，肯定会有大量的用户愿意去用，能够产生大量DAU，如果效果是比较好，这些用户是愿意留下来继续使用它的，久而久之其实是会改变到用户的搜索习惯。
Q：字节内部目前在类 chatGPT 产品方面的规划？
A：从我们看字节对搜素的重视程度，搜索现在也是一级部门，对搜索的重视程度很高，因为搜索在现在在抖音、今日头条的重要性上很高，本次也是集合了几个核心的部门，组成小团队来做模型。目前来说可能还没有产品的计划，星然是比百度晚一些，但后续要看产品的效果和用户的体验先发后发的影响不是很大，需要看后续的发展。
Q：谷歌最近在财报上说，他们的LaMDA 模型可能在近期推出类似ChatGPT 的功能，如何看待谷歌在语言模型方面的积累？
A：1）谷歌的技术积累很不错，团队都非常优秀，模型积累很好。
2)数据方面，谷歌天然就有很多搜奈引擎的数据，算力方面也不用担心，很多技术都是谷歌推行的。相对来说谷歌研发类似产品的可行性非常大，而且成功概率非常高。而且它的效果也是值得我们期待的。如果效果比ChatGFT好的话，那也算一种后发优势。
Q：如果未来出现很多的模型，这些模型都基于差不多的数据去训练出来的，,又有很多应用去基于这些模型去开发不同领域的垂直应用。整个环节的价值量最大的地方会不会在公有云跟硬件厂商。因为最后有可能模型会趋于雷同，甚至很多应用程序会被迅速的抄袭，迅速的雷同化？
A：1）他们肯定是受益者，但这种说法有一个前提，算法是有上限的。但是实际来看，各家公司的算法上限不同，不同的公司，它掌握的能力不一样，算法还是有很大的提升空间，我认为不会在短期内趋于雷同。模型的发展的效果。可能是越来越往上的。
2）发展的模式也有区别。可能会有一批大的公司搞基础性的模型，比方类似于 GPT 这种模型，其实 ChatGPT，它也是GPT-3.5的版本上，做了一些微调而做的产品。还有公司做应用层面/垂直赛道的小模型开发。未来是两种发展模式相结合。
2：字节和百度在该方向的算力、数据和人员投入如何？
A：1）国内大厂的算力基础都不差。在模型方面，字节在推荐领域也已经有千亿参数的大模型，只是说在应用的领域不同。百度有文心大模型作为基础。
2)数据方面，字节也有一些头条和抖音的搜索数据，量级上没有百度搜素的数据量大。从投入来看，其实两个公司的投入都非常大。百度把 AIGC 作为一个发展浪潮来追赶的，而且搜索是它非常核心的业务场景，所以百度的投入是很大的，而字节，其实切入的稍微有点晚，没有百度那么快。字节把几个最重要的核心部门联合起来成立专项团队。其实整体上来说投入也还可以。
4）所以综合比较，在算力和数据上，字节跟百度的区别可能没有那么大。但在人力投入上，因为搜索是百度的核心业务，百度的整体的投入可能会比字节更大一些。
2：现在 ChatGPT 没有对国内开放，国内厂商在中文的领域，相比海外厂商，在用户体验上能形成一定的或者明品的优势？
A：我认为语言不是大的壁垒，我认为短期内，ChatGPT 没有向我们大陆开放，我们国内其实是有机会这样做出来产品的，但是想要超越
ChatGPT 的可能性会非常低。因为像一些我们的头部大公司，目前来说也还没有推出一款产品，能够跟 ChatGPT 的模型的效果能够PK，所以可能短期来看我觉得不大能够超过它。但是我们短期来看，我们可以通过这样的一个时间窗口，我们可以做逼近它的效果，是国内公司比较好的状态
＆：腾讯和阿里在 AIGC 方面的布局如何？
A：1）腾讯和阿里的搜索业务弱一些，不是重点，例如阿里，主要聚焦于电商领域，所以他可能在 ChatGPT 上不会有很多布局，目前阿里主要的发力方向是利用 AIGC 去做 AI+营销，比如赋能商品的文案撰写等，未来阿里可能会继续往这个方向布局。
2）腾讯可能在广告、社交、游戏等领域应用 AIGC 技术。比方塑造更广义的互动叙事的品类，带来一些新的社交的玩法和商业模式的新的启发等等。总的来说，AIGC 是一波技术浪潮。国内的大厂的看法是要和现有的业务结合起来，实现自身业务更好地发展。而不是只关注 ChatGFT这一个 AIGC 的细分赛道。
Q：可以大概理解成，腾讯和阿里更偏向应用端吗，未来腾讯和阿里的大模型会自研吗？
A：我认为腾讯和阿里的大模型是会有自研的趋势的。像这种大公司，它对专利，包括一些专业的技术积累其实还是比较有讲究的。所以我觉得长期来看，大厂大模型会自研。
＆：如果大模型投入使用，对于算力等基础设施的需求会不会是指数级的提升？
A：我认为是的，ChatGPT 刚发布的时候，就因为用户访问量过大，算力不足而出现问题。随着用户量级的大规模的上涨，算力的需求确实会呈现一个指数级的上涨。至少是非常正相关的，因此推理和训练的资源的开销肯定是非常大的。所以这一块也是优化的重点，就是怎么去让资源尽可能地节省，让整体的一个性能更好地提升。
Q：除了 GPU，芯片方面还有可以替代的产品吗？
A：1）自研芯片，但是目前整体来说目前还没有看到特别好的一个产品。
2）采用分布式的CPU，性能上差一些，但是成本便宜，很适合做推荐算法模型的公司，比如抖音、快手、Tiktok 等，都是采用分布式的 CPU 做大模型的基础算力设施。
Q：如何去辨别海内外厂商大模型的优劣？
A：如果我们要评价它的具体的效果，最直接的是人工测评，看下真实的感受和评分。专业角度来讲，我们可以用测试集，分别请求这些模型的API，基于一些评价指标，去看这些模型的表现如何。模型的参数、训练数据可以作为参考的指标。它的模型的参数量级更大，理论上模型的效果应该会更好，但相对片面一些，还是要实际测试和感受后才知道。
Q：应用场景的数据，在中国来讲是不是一种比较紧缺的资源。如果是要把模型训练好，可能非常依赖这些产业厂商的合作？
A：1）特定领域的数据是比较稀缺的，比如医疗、司法等领域，所以可能会生成类似的商业模式。
2）可能最后就会形成这种商业模式：大公司负责训练大的基础模型，其他的一些创业型的公司或者一些小公司，在大模型的基础上，加上他们自己特定领域的一些数据集，得到这种新的领域式的模型，来服务于他们自己的一些商业化的计划。
3）这种模式下，大厂有钱赚，对于小厂来说，它既能保护到自己的数据的隐私，同时也能够形成这样自己的领域类的商业化的路径。

声明：文章观点来自网友，仅为作者个人研究意见，不代表韭研公社观点及立场，站内所有文章均不构成投资建议，请投资者注意风险，独立审慎决策。

百度集团-SW

视觉中国

神思电子

奥飞数据

工分

8.19

投诉

复制链接

分享到微信

有用 4

打赏作者

无用

真知无价，用钱说话

0个人打赏

同时转发

只看楼主

热度排序