登录注册
昆仑万维开源“昆仑天工” AIGC模型开源成生态破局关键?
野区指挥官
不要怂的韭菜种子
2022-12-16 10:17:50

12月15日,昆仑万维在北京举行AIGC技术发布会,会上昆仑万维CEO方汉正式发布了“昆仑天工”AIGC全系列算法与模型,并宣布模型开源。“昆仑天工”旗下模型包括天工巧绘SkyPaint、天工乐府SkyMusic、天工妙笔SkyText、天工智码SkyCode,覆盖图像、音乐、文本、编程等多模态内容生成能力,标志着昆仑万维成为目前国内AIGC领域布局最为全面的公司之一,也是国内第一个全身心投入到AIGC开源社区的公司。


模型开源正在带动AIGC生态发展。海外方面,有今年8月Stability AI公司免费开源文图生成模型Stable Diffusion代码,催化了AI绘画应用的爆发式增长。今日,昆仑万维(300418.SZ)又发布了“昆仑天工”AIGC全系列算法与模型,宣布模型开源。 

  昆仑万维CEO方汉对财联社记者表示,开源对公司来说更多是一个弯道超车的机会。“会让我们的模型跟算法比与我们同等规模的企业、甚至比大厂的迭代速度都快,并会让更多创业公司、个人开发者在我们的基础上免费去做第三方的应用和开发,这是我们希望看到的事。”

  据了解,昆仑万维从2020年开始布局AIGC领域,训练集群200张卡,投入数千万元,组建了200余人的研发团队。此次发布的“昆仑天工”旗下模型覆盖图像、音乐、文本、编程等多模态内容生成能力。目前,AI图像、AI文本、AI编程的模型已经在GitHub上开源。

  模型开源意在降低行业门槛、促进技术“平民化”。“软件开源是大势所趋,开源的软件会迭代得更快、更安全、更容易获得用户信赖。通过开源可以高效地获得用户,拓展全球市场,打造更加繁荣的AI应用生态。”LVS开源项目领军者、阿里云前CTO、中国计算机协会理事章文嵩表示。

  不过,开源也意味着会牺牲掉一部分盈利机会。曾引发业内重大关注的OpenAI公司的GPT-3模型至今都没有开源,而是只提供API付费服务。但方汉表示,利润的产生不一定在模型端,而在于应用端。“现在的模型跟技术主要还是用来生成素材,到生成用户可消费的内容仍有距离。我把生成素材这个部分开源,并不代表把素材变成内容的这个过程也开源。”

  也就是说,尽管模型开源后不收费,但可以效仿MangoDB数据库、大数据公司Databricks的模式,在商业支持、云服务方面变现收费,从而形成收入来源。

  考虑到当前AIGC行业还处于发展的早期阶段,谈论大规模商业化应用落地并不现实。也因此,市场关注点大都放在了AIGC对实际业务的降本增效赋能上。

  目前,昆仑万维在AI作曲模型上已经开始了商业化变现,并且在实际业务中大幅降低了游戏音乐的研发成本。“我们现在的游戏已经内部采购了大概200首AI生成的音乐,折算成原来的外包成本就是一笔约400万元的费用。”方汉表示。

  记者了解到,昆仑万维现在用AIGC完全取代了游戏作曲和图标两项业务。此前,行业平均外包一个游戏图标要花费600元,外包一首乐曲大概要2万元。方汉表示,“现在可能AI生成一个图标的成本不超过一分钱,平均一首乐曲的生产成本不超过5块钱。原来外包一首曲子,平均制作周期是两周到一个月左右,而现在生成一首乐曲应该不超过两秒钟。AIGC对整个内容行业的生产方式绝对是颠覆性的。”

  海通证券传媒互联网首席分析师毛云聪表示,AIGC除了效率提升、创作供给,促进多个行业降本增效之外,对元宇宙也具有变革性的力量。“我们在元宇宙里观察到的每一帧画面,都需要大量的算力和消耗,靠人工创作工作量非常大,因而需要‘聪明’的AI来创造内容。”



AI图像方面,天工巧绘SkyPaint采用全球第一款多语言Stable Diffusion分支模型,兼容Stable Diffusion;使用1.5亿中英双语语料,支持中英双语输入实现文字生成图像,是国内为数不多的支持中英双语的文图生成模型。

 

  AI音乐方面,天工乐府SkyMusic是国内第一款商用级作曲AI模型,该模型引入全局信息约束、和弦隐式表征,和弦准确率达到92.5%,远超目前行业最佳64.7%;支持中文、英文、日文、韩文、法文等31种语种,支持从旋律生成歌词、文案素材生成歌词,且支持全球多曲风。基于昆仑万维旗下StarMaker平台大量优质作品曲库,天工乐府具备高效供给具备ISRC版权认证的歌曲、配乐及氛围音乐等高质量AIGC音乐的能力。目前面向全球音乐市场,已在美国、韩国、印尼等国家及全球180多个音视频平台发行了近20首人工智能生成歌曲。

  AI文本方面,天工妙笔SkyText4采用生成效果最好的开源GPT中文预训练大模型,针对中文领域构建了千亿级别的高质量数据集,通过高性能A100-GPU集群,训练200张显卡,训练4周,后续优化2周,得到百亿参数量的GPT-3生成模型,提供包括续写、对话、中英翻译、内容风格生成、推理、诗词对联等功能,与现有大模型的比试中排列前茅。

 

  AI编程方面,天工智码SkyCode采取全球第一款多语言开源编程大模型,支持多种主流代码语言SkyCode能够生成的代码,不仅包括使用广泛的python、Java、C等,还涵盖了php、go、swift等共计十余种编程语言,使不同语言的使用者都能来体验SkyCode强大的代码生成能力。

 

作者在2022-12-16 10:22:12修改文章
声明:文章观点来自网友,仅为作者个人研究意见,不代表韭研公社观点及立场,站内所有文章均不构成投资建议,请投资者注意风险,独立审慎决策。
S
昆仑万维
工分
3.67
转发
收藏
投诉
复制链接
分享到微信
有用 2
打赏作者
无用
真知无价,用钱说话
0个人打赏
同时转发
暂无数据