登录注册
人工智能三大件:算力、算法、数据。高质量数据是人工智能时代的锂矿
牛🐮🐮🐮
2023-04-11 20:44:25

数据资源价值几何?

AI大模型需要的参数量和数据量非常庞大,以ChatGPT为例,它最初的GPT-1参数量只有1.17亿,到了GPT-3其参数规模就达到了惊人的1750亿。如今,人工智能模型体量已跃升至“万亿级”规模。

“人工智能模型体量已跃升至万亿级参数规模,对于数据资源需求非常庞大。大模型开发需要用于预训练的海量非结构化数据、人机协同生产的数据以及知识库数据集。”谢后勤认为,数据体现在立足超大规模、覆盖所有领域的数据集进行训练,为了能保障数据的质量,又必须通过清洗与标准来强化数据的真实性、准确性、完整性与时效性。

AI大模型的发展也带火了数据资源板块。同花顺数据显示,4月11日,文化传媒板块上涨4.89%,高居行业板块涨幅榜首。

掌握核心数据的企业成为市场追逐的目标。4月10日,中文在线在互动平台回答投资者提问时就表示,“国内多家模型公司正就采购公司中文数据进行合作磋商。”

在卢言霞看来,“AI大模型的核心之一就是基于海量数据资源的训练。面向什么场景,就需要什么数据,而且需要的还是海量的数据。”

中文在线还表示,“公司拥有海量的正版内容及自有内容创作生态作为数据和生态支撑,与优秀的模型技术公司共同探索AIGC技术在文学作品创作领域新的发展方向并进行商业化尝试,包括但不限于AIGC辅助创作、文本自动生成,同时共同探索利用AIGC技术实现漫画、动画等可视化作品的创作或辅助创作业务,从而实现降本增效并创造出具有更多可能性、创新性的作品。”

作者利益披露:转载,不作为证券推荐或投资建议,旨在提供更多信息,作者不保证其内容准确性。
声明:文章观点来自网友,仅为作者个人研究意见,不代表韭研公社观点及立场,站内所有文章均不构成投资建议,请投资者注意风险,独立审慎决策。
S
开普云
S
中文在线
S
中国科传
S
视觉中国
S
拓尔思
工分
1.65
转发
收藏
投诉
复制链接
分享到微信
有用 4
打赏作者
无用
真知无价,用钱说话
0个人打赏
同时转发
评论(2)
只看楼主
热度排序
最新发布
最新互动
  • 无名小韭888
    奉旨割肉的韭菜种子
    只看TA
    2023-04-11 22:05
    锂矿?数据是一点都不值钱!
    0
    0
    打赏
    回复
    投诉
  • 子非鱼00900910
    一路向北的老司机
    只看TA
    2023-04-11 22:01
    谢谢你
    0
    0
    打赏
    回复
    投诉
  • 1
前往