3月8日发送:
Gartner:2024~2030年60%至几乎所有的大模型数据都是“合成数据”
3月10日发送:
核心观点1:人M网那个AI数据筛查,是标,而“合成数据”才是治本,才是郭嘉解决模型数据来源风险的终极解决手段。
核心观点2:无论深挖多少运营商数据、广电直播带货数据的潜能,都远远不够模型训练所用,而且有隐私风险,而到2024~2030年,模型训练的主要数据都将是“合成数据”
全球IT研究与咨询机构Gartner预测,到2024年用于训练大模型的数据中有60%将是合成数据,到2030年大模型使用的绝大部分数据将由人工智能合成。《麻省理工科技评论》(MIT Technology Review)将大模型合成数据列为2022年十大突破性技术之一,称其有望解决人工智能领域的“数据鸿沟”问题。可以预见,合成数据作为数据要素市场的新增量,在具备产业价值的同时,也可以解决人工智能和数字经济的数据供给问题。(来自韭研公社APP)