人工智能革命？ChatGPT的机会在哪里

GPT项目从18年6月发布第一代产品GPT-1，当下市场普遍讨论的ChatGPT发布在22年11月30日，作为GPT-3和GPT-4之间的过渡产品，实验性质比较重，但即便如此依然引起了全球范围的震动。因为ChatGPT，太像人了！

首先受影响的是教育行业

去年底，一个美国高中英语老师在媒体上控诉AI，标题是《高中英语已死》。作为一个12年教龄的英语老师，他承认“根本看不出AI文和真人文之间的区别”。

同样的事情也发生在北密歇根大学的“全球宗教”课堂上，学生用ChatGPT完成了对课题“禁止罩袍带来的道德问题”的讨论。教授安东尼·奥曼（Antony Aumann）表示这是“难得一见的好论文”。

对于教育界来说，这意味着很多传统的教学方式都需要改变。今年一月，纽约市教育部宣布，禁止全市师生在公立学校的网络和设备上访问ChatGPT的网站。很多大学正在修改学术诚信政策，把“使用AI”列入作弊手段。

当然改变就意味着机会，如此成熟的对话AI意味着在线上教育AI问答、作业审批、甚至考试测试等多个方面均有巨大机会。具体到今天的市场上，教育股下午拉涨，学大教育、赛为智能领涨正是这个逻辑。

说回ChatGPT

前文已经提到，ChatGPT属于GPT-3和GPT-4之间的过渡产品。所以目前来看存在的一些问题例如“违反伦理”“内容错误或矛盾”的情况应该会在GPT-4中修复。GPT-4的发布时间预告在22.12-23.2，换句话说就是下个月可能发布，一旦发布又是对整个人工智能板块的大利好。

同时基于GPT历代产品的公开信息，有几个值得关注的点：

一、数据，大量的数据！

从GPT-1到GPT-2预训练数据量（及原型产品训练数据量）翻了8倍，从GPT-2到GPT-3翻了1000倍！ChatGPT和GPT-4的预训练数据量目前无从得知，虽然有消息称GPT-4运用了更好的训练模型，但一方面要适应各行各业的实际应用要求，一方面要同步更新数据。意味着GPT-4在实际应用领域中仍需要大量的数据喂养，在产业化的应用中数据基建非常重要。数据基建就包括我们一直在提的数据库产业链、数据交易概念一系列企业，之前的文章里都有提过可以翻一翻，站在ChatGPT的环境下可能有新的感觉。