GPT项目从18年6月发布第一代产品GPT-1,当下市场普遍讨论的ChatGPT发布在22年11月30日,作为GPT-3和GPT-4之间的过渡产品,实验性质比较重,但即便如此依然引起了全球范围的震动。因为ChatGPT,太像人了!
首先受影响的是教育行业
去年底,一个美国高中英语老师在媒体上控诉AI,标题是《高中英语已死》。作为一个12年教龄的英语老师,他承认“根本看不出AI文和真人文之间的区别”。
同样的事情也发生在北密歇根大学的“全球宗教”课堂上,学生用ChatGPT完成了对课题“禁止罩袍带来的道德问题”的讨论。教授安东尼·奥曼(Antony Aumann)表示这是“难得一见的好论文”。
对于教育界来说,这意味着很多传统的教学方式都需要改变。今年一月,纽约市教育部宣布,禁止全市师生在公立学校的网络和设备上访问ChatGPT的网站。很多大学正在修改学术诚信政策,把“使用AI”列入作弊手段。
当然改变就意味着机会,如此成熟的对话AI意味着在线上教育AI问答、作业审批、甚至考试测试等多个方面均有巨大机会。具体到今天的市场上,教育股下午拉涨,学大教育、赛为智能领涨正是这个逻辑。
说回ChatGPT
前文已经提到,ChatGPT属于GPT-3和GPT-4之间的过渡产品。所以目前来看存在的一些问题例如“违反伦理”“内容错误或矛盾”的情况应该会在GPT-4中修复。GPT-4的发布时间预告在22.12-23.2,换句话说就是下个月可能发布,一旦发布又是对整个人工智能板块的大利好。
同时基于GPT历代产品的公开信息,有几个值得关注的点:
一、数据,大量的数据!
从GPT-1到GPT-2预训练数据量(及原型产品训练数据量)翻了8倍,从GPT-2到GPT-3翻了1000倍!ChatGPT和GPT-4的预训练数据量目前无从得知,虽然有消息称GPT-4运用了更好的训练模型,但一方面要适应各行各业的实际应用要求,一方面要同步更新数据。意味着GPT-4在实际应用领域中仍需要大量的数据喂养,在产业化的应用中数据基建非常重要。数据基建就包括我们一直在提的数据库产业链、数据交易概念一系列企业,之前的文章里都有提过可以翻一翻,站在ChatGPT的环境下可能有新的感觉。
二、AIGC即将掀起内容生产革命
AIGC即AI内容生产。去年年底AI绘图就火了一段时间,各种细节问题很多暂时不具备产业化能力。但以ChatGPT目前展现出的成熟度,在许多低门槛的内容创作领域已经完全达标了,甚至是在高门槛的创作中,也能作为工具大大提升创作者的创作效率。
对比GPT-3和阅文集团的数据:
在生产效率方面:21年3月,GPT-3日均文本生成量45亿,同年阅文集团全年新增文字量360亿,相当于GPT-3 8天的文字内容生成量;
在内容成本方面:目前OpenAI定价最高的文字模型达芬奇(基于GPT-3)为每750词约0.02美元,同样是21年阅文集团内容成本为17.74亿元(每750词约37元),是调用OpenAI的API完成相同文字量生产所需的成本(约672万元)的264倍。
对于低门槛创作者来说,只需要输入创意、生成内容、人工微调即可产出成品内容。当然高门槛内容创作依然有稀缺性,但可能很快就会有一批网文写手发帖子称“网文已死”了。
当然以上只是拿网文举例子,事实上GPT-4问世之后AIGC发挥拳脚的地方比比皆是:编程语言方向上:代码生成、软件行为生成;自然语言方向上:新闻撰写、文案创作、对话机器人、创作性文本均有极大的舞台
(如果说学大教育封板是因为aigc在教育领域的落地,那最核心的应该是国新文化了,人家本来就是干这个的)