登录注册
BuzzFeed股价两日跳涨三倍后,谷歌带着ai音乐MusicLM又来了
十八湾
明天一定赚的散户
2023-01-30 11:00:40
【东吴传媒互联网&策略团队】ChatGPT强势出圈对于A股投资的启发和投资主线思考

我们在近期发布深度专题《ChatGPT:又一个“人形机器人”主题》,引发市场关注,关于其中的逻辑及投资机会,我们重申:

一、近期ChatGPT在各领域快速出圈,主要包括:
1)微软宣布 Azure OpenAI 服务现已在微软全球 Azure 平台正式发布,用户将能够通过 Azure OpenAI 服务快速访问 ChatGPT;
2)BuzzFeed宣布计划使用ChatGPT开发商OpenAI提供的人工智能(AI)技术来协助创作个性化;
3)Nature禁止使用来自ChatGPT的文本,并表示ChatGPT不能被列为合作者。

二:ChatGPT的强势出圈对A股投资的启示在于:
1)ChatGPT的广泛应用,甚至快速形成对于传统内容生产的冲击,已经意味着AI技术进步显著,能够作为高效生产力工具服务于B端或C端,虽然面临一些版权、伦理问题,但也意味着广泛的应用场景及从0到1的投资机会;
2)由于文本仍然是当前最通用的交互媒介,因此相比图片(可能还会面临版权风险)、音频等更容易实现出圈,GPT所基于的预训练模型Transformer在语言AI甚至AI整体领先,可以实现低成本、高效率、大规模的训练,因此当前ChatGPT可能仍然是AI应用领域最闪亮的细分领域;
3)中长起来看,AI将深度参与到更广泛的数字内容领域的创作,成为规则制定的参与者,从而提高生产效率。

 

1月26日、27日两天股价上涨3倍,1月28日谷歌又发布AI前沿成果MusicLM,生成式AI迎来爆发

 “继ChatGPT之后,音乐或将成为AI内容生成的前沿领域。

当地时间1月27日,谷歌发布全新AI模型——MusicLM。通过AI模型MusicLM,文字可以直接生成高保真的音乐。

这是继文字生成AI模型Wordcraft、视频生成工具Imagen Video之后,谷歌又一次推出生成式AI模型工具,这一次谷歌将目标瞄准了音乐领域。

透过MusicLM,不难看到,这两年生成式AI赛道正在迎来爆发。

01

MusicLM 挑战更复杂场景

 谷歌最新推出的AI模型MusicLM,可直接将文字、图像自动生成音乐,并且曲风多样,凡是想听的音乐,基本都能自动生成。

MusicLM并非是第一个可自动生成音乐的AI模型,此前,可视化AI工具Riffusion也能自动创作音乐,还有Dance Diffusion,此外,当前最热门的聊天机器人ChatGPT的研发者OpenAI也推出过Jukebox。

但值得注意的是,这些可自动生成音乐的AI系统,受限于技术和数据等因素,创作的音乐都比较简单,相对而言并不复杂。

和前辈们不同的是,MusicLM可创作特别复杂和保真度特别高的音乐,也可通过图像生成音乐。这算是实现了全新突破,通过AI技术不仅可以识别乐器,融合音乐流派,还可以通过更抽象的概念生成音乐。

比如,想要街机游戏配乐,只要输入“街机游戏的主配乐,它节奏快且乐观”等文字,MusicLM便可自动生成音乐。MusicLM也可通过图像生成音乐,例如世界名作《呐喊》《格尔尼卡》《星空》等皆可作为素材来源。

不过,值得一提的是,目前谷歌只是发布了MusicLM的研究成果,因为版权等问题,谷歌还未向公众开放MusicLM。

02

AI生成音乐难在哪?

去年10月,谷歌在生成式AI模型上已经推出过AudioLM,只需输入短时音频,就能生成相似风格的音频。彼时AudioLM只是纯音频模型,这个技术类似于语言模型,根据提示的语音内容,自主判断并生成相似内容。

从这个角度看,AudioLM可视为是MusicLM的前身。AudioLM在不进行转录或标记的情况下,可以模仿音频的音色、响度和清晰度等。但是,AudioLM生成的音频和原版并无太大区别,并未得到公开应用。

通过AI模型创作音乐,这件事并不容易,因为生成的音乐包括音频信号、环境声音、人的声音等多个维度,是由很多信号相互作用形成的,而人体每次向外发出的声音,无论声音响度大小、音色好差,都由句法、音律等组成,这是非常复杂的综合性系统。

也恰恰是这些原因,在早期的探索过程中,自动生成的音频合成痕迹明显,声音听起来并不自然,发音也都不标准。因此AI模型要想实现真正意义上的自动生成音频,依靠海量的数据训练和模拟,是必不可少的基础性步骤。

针对这些挑战,作为AudioLM的“升级版”,MusicLM的训练数据更加庞大。据了解,谷歌在28万小时的音乐数据集中,才训练出MusicLM,为理解深度和复杂的音乐场景提供了基础。

此外值得一提的是,针对任务缺乏评估数据等问题,谷歌专门引入了MusicCaps,用于文本到音乐的生成任务评估。

03

生成式AI迎来爆发

此次谷歌推出MusicLM,可视为拓展AI应用的注脚,背后则是生成式AI赛道的爆发。事实上,生成式AI一直是近两年最炙手可热的话题。

2021年,OpenAI相继发布了划时代的DALL-E、DALL-E 2模型,实现了文本生成图像的跨越;去年,Meta发布了AI短视频生成模型Make-A-Video,同样可由文本内容生成视频;谷歌也发布了短视频AI生成模型Imagen Video与Phenaki。

不止是国外,国内也有很多生成式AI应用。比如,字节跳动旗下剪映APP,可根据文字内容自动生成匹配的视频画面。去年初,网易推出了“网易天音”,也是一站式AI音乐创作平台,可将用户编辑的内容通过AI自动生成为歌曲。

可以看到,生成式AI应用的场景越来越广泛,写作、绘画、剪视频等等,都可以通过AI技术实现。基于生成式AI广泛的应用前景,谷歌、微软、Meta等巨头们纷纷推进研发,将生成式AI技术融合到产品中,这加速了生成式AI赛道的爆发。

事实上,生成式AI高速发展并非是这两年的事,只是因技术门槛过高,其前沿动态一直在科技圈小范围流传。直到AI绘画、AI写作等频繁出圈,生成式AI得到了更广泛的关注。

生成式AI赛道爆发有必然原因,大数据和算法应用越来越成熟,模型工具越来越完善,这都加速了生成式AI应用的迭代。当前,生成式AI已经迎来爆发,未来还有巨大的发展潜力。根据Gartner统计数据,预计到2025 年,生成式AI将占所有生成数据的10%,而目前的比例还不到1%。

当然,任何技术都是一把“双刃剑”,生成式AI也面临着版权问题等挑战,此外还面临由AI生成“错误”引发的各种损失,就目前来看,还离不开人为干预。但长期而言,生成式AI巨大的发展潜力已经成为共识。


附ai音乐股

1,万兴科技

 2、苏州科达

 

 

作者利益披露:原创,不作为证券推荐或投资建议,截至发文时,作者不持有相关标的。
声明:文章观点来自网友,仅为作者个人研究意见,不代表韭研公社观点及立场,站内所有文章均不构成投资建议,请投资者注意风险,独立审慎决策。
S
万兴科技
S
苏州科达
工分
14.99
转发
收藏
投诉
复制链接
分享到微信
有用 7
打赏作者
无用
真知无价,用钱说话
0个人打赏
同时转发
评论(2)
只看楼主
热度排序
最新发布
最新互动
  • 只看TA
    2023-01-30 17:53
    谢谢
    0
    0
    打赏
    回复
    投诉
  • 抢板作手
    不要怂的龙头选手
    只看TA
    2023-01-30 12:02
    0
    0
    打赏
    回复
    投诉
  • 1
前往