登录注册
阿里巴巴AI大模型报告解读(前瞻)
金融民工1990
长线持有
2023-08-03 21:35:33

1. 阿里巴巴阿里云的模型架构搔和数据规模

(1) 阿里巴巴采用的模型架构和数据规模

阿里巴巴的模型采用基于m6os搔a的统一架构,使用duchy should transformincluder decoder以及restblock和统一的底座进行训练。数据规模包括了约1.9TB的图像数据和20090多GB的文本数据,总体数据量超过了2.2万亿。

(2) 阿里巴巴阿里云在模型能力上的优势

根据ABC对国内模型能力的对比,阿里巴巴的通信系列模型在通用能力、服务能力、创新能力、平台能力和生态合作能力方面达到了满分的能力。

(3) 阿里巴巴在互联网领域中的地位

在互联网领域中,阿里巴巴和百度处于领先地位,其他互联网大厂还在追赶。大模型的排名和竞争要素短期内取决于迭代效率,长期内取决于大模型应用生态和垂直领域数据的function以及大模型的反馈。

(4) 阿里巴巴的生态优势

阿里巴巴具备强大的生态优势,通过业务生态全面接入自己的AI大模型来促进其发展。

(5) 阿里云在中国AI公有云市场的市占率和预测

阿里云在中国AI公有云市场的市占率约为30%,预计到2026年,中国AI公有云市场规模可能增长到接近400亿左右,届时阿里云的市占率有望维持在30%到40%左右,阿里云的AI公有云软件收入可能达到约150亿左右。

(6) Model as a service领域的商业化机会

阿里云的modelscope社区聚集了大量的AI开发者和优质的AI模型,商业化推进后也能为阿里带来一定程度的收入增量。

(7) 阿里云的估值和阿里云IPO的潜力

目前阿里云的估值可能是两倍ps,随着阿里云拆分上市的推进,阿里云带来的估值增量可能会逐渐释放,可能还会有进一步的上升空间。

2. 阿里云在大模型领域的历史积累和技术投入

阿里云在大模型领域有较早的积累。早在4年前,阿里成立了数据科学与技术研究院,并在2016年成立了人工智能实验室。阿里在人工智能领域进行了持续的投入和储备,在模型层和应用层都进行了不断的完善。阿里成立了自有的AI芯片团队,并在2019年发布了首款AI芯片。在2020年启动了m6项目,并在21年快速迭代发布了10万亿的大模型。阿里还将人工智能和内部业务深度融合,提升业务效率,并在多个业务领域进行了融合。阿里不仅在内部自研投入,还积极进行对外投资,涉及芯片、机器视觉、深度学习和应用等领域。

3. 阿里云在大模型能力上的优势和技术投入

根据IDC的测评结果,阿里的统一大模型在通用能力、服务能力、创新能力、平台能力和生态合作等方面都取得了满分成绩,整体能力相对其他大模型有显著领先优势。

阿里云在技术投入、算法模型算例和数据方面具有领先能力。阿里根据AI时代重新定义了三层技术架构,包括云基础设施、大模型和调用工具。阿里提供了丰富的大模型和学习产品,助力整个模型的发展和训练。阿里云率先推出了大模型社区和调用工具,降低了大模型的使用和开发门槛,加速了模型的发展和迭代。

阿里在技术路线上采用了天色flow和拍的模式进行迭代,在大模型方面关注海外进展,并在2019年开始关注transport模型,2020年正式启动了m6项目。阿里的m6采取了应扣的抵扣架构,在自然语言生成能力上与拆GPT存在差距。随着验证抵扣架构的有效性和高质量数据和反馈激励的作用,国内大模型技术路线也朝着这个方向不断发展。阿里的m6在模型底座上的设计主要集中在两个方面,一是打造多模态统一底座,二是追求模型训练效率。

具体来说,阿里云通过transport、d口和RS的架构进行运行预训练和微调,不需要为不同任务设计特定的模型层,实现了架构的统一。阿里还将自然语言处理、计算机视觉和多模态任务统一到同一个框架和训练范式中,实现了模态统一。同时,将涉及多模态和单模态的任务统一建模成序列到序列的任务,使得模型可以同时学习多个任务。通过一次性训练,可以获得文本生成、图像生成和跨模态理解等多种能力,实现了任务统一。m6通过模块化设计统一了多模态理解和生成,实现了大模型的轻量化和任务水平的提升。模块化大模型通过切分独立模块,包括基础层、通用层、任务层和功能性模块,实现了灵活拆拨和微调,实现了大模型的轻量化和任务水平

Q&A

Q:公司在人工智能领域的积累和投资有哪些方面的成果?

A:阿里巴巴在人工智能领域早在搔4年前就成立了数据科学与技术研究院,并于2016年成立了人工智能实验室。阿里巴巴在数据算法和算例方面有丰富的积累,并在AI核心产业环节积极进行对外投资。阿里巴巴在芯片领域投资了寒武纪、深圳科技等企业,在机器视觉和深度学习领域投资了商汤科技、旷视科技等公司,在应用领域投资了小艾机器人等公司,通过打造AI生态圈与产业链上的企业实现共赢。

Q:公司的大模型在哪些能力上具有优势?

A:根据IDC的测评结果,阿里巴巴的统一大模型在通用能力、服务能力、创新能力、平台能力和生态合作等方面都达到了满分的成绩,具有显著的领先优势。

Q:公司的大模型是如何实现领先能力的优势的?

A:阿里巴巴的大模型通过技术投搔入、算法模型算例及数据的角度进行优化。在技术架构方面,阿里巴巴重新定义了云基础设施的三层技术架构,提供了稳定和高效的基础设施。在模型设计上,阿里巴巴注重统一的输入输出形式和学习范式,实现了模态统一。此外,阿里巴巴通过模块化设计统一了多模态的理解和生成,并实现了大模型的轻量化和任务水平的提升。算力方面,阿里巴巴推出了派乘0进制算的服务,支撑10万亿参数的大模型训练。

Q:公司的多模态模型m6在哪些方面取得了成果?

A:阿里巴巴的多模态模型m6经过快速迭代,参数规模在2021年达到了千亿,在2021年达到了万亿,并在多个下游任务中表现出优秀的性能。在2021年11月,模型的参数规模迭代到了10万亿,成为全球最大的训练模型。

Q:阿里在研发m6时采用了哪些训练数据集?

A:阿里在研发m6时自己搭建了一个中文的多模态的训练数据集,其中包含了1.9tb的图像和222292tb的文本。

Q:阿里推出的爱丽丝曼模型在哪些领域有突出表现?

A:阿里推出的爱丽丝曼模型在多语言生成、多模态结构化等领域有突出表现。

Q:阿里云推出了哪些云服务器来提升AI的训练性能和计算速度?

A:阿里云推出了搭载英伟达a100v100等多种型号的gpu的云服务器,能够显著提升AI的训练性能和计算速度。

Q:阿里云在哪些领域有望受益于AI的快速发展和算力需求的增加?

A:阿里云在计算机视觉和智能语音领域有望受益于AI的快速发展和算力需求的增加。

Q:阿里云如何将机器学习平台、视觉智能和自然语言处理等AI能力进行商业化推广?

A:阿里云将机器学习平台、视觉智能和自然语言处理等AI能力打造成标准化的产品进行销售,并采用订阅和API按需收费的方式。

Q:AI的快速发展会带来哪些商业化的潜力?云厂商有望成为哪方面的主要承载方?

A:AI的快速发展会带来办公效率的提升和AI增量算力需求的增加,云厂商有望成为AI增量算力需求的主要承载方。

Q:阿里云在AI公有云市场的份额和收入贡献如何?未来有望达到什么规模?

A:阿里云在我国的公有云市场份额约为30%,AI公有云的收入贡献从2021年的1%提升到2022年的2.8%。根据预测,2026年我国的AI公有云市场有望达到百亿规模。

Q:阿里的大模型在哪些应用场景有潜在的落地方向?

A:阿里的大模型在文字归纳与生成、创意性内容生成、代码开发等领域有广泛应用的潜力。

Q:阿里的大模型在哪些具体应用场景有望大规模落地?

A:阿里的大模型在办公场景、电商领域和智能终端等具体应用场景有望大规模落地。

Q:钉钉如何接入阿里的大模型来提升协作效率?

A:钉钉已经全面接入阿里的大模型,用户可以通过斜杠调用统一大模型的能力,实现对群聊工作讨论推文创建、视频会议等场景协作效率的大幅提升。

Q:阿里的电商业务和AI能力结合后有哪些优化效果?

A:阿里的电商业务和AI能力结合后可以通过智能推荐辅助决策来优化消费者的购物体验,降低决策成本;通过AI辅助创意生成和智能客服降低商家的营销和运营成本;提供更精准的用户洞察,提升商家的经营产出。

Q:

Q:高德在出行领域有哪些服务?

A:高德在出行领域提供了路线导航、路况提示等服务,并正在升级为综合的消费者服务平台,将接入通1000问带来智能化能力的提升。

Q:高德在驾驶和出行场景下有什么计划?

A:高德有望提供更多的智能出行和目的地相关推荐的服务,以进一步优化用户的驾驶和出行体验。

Q:阿里在音视频领域有哪些AI产品?

A:阿里在今年6月发布了聚焦音视频的AI产品通工艺听wou,这是国内首个开放公测的大模型应用产品。通一听物具备了理解和摘要的能力,可以帮助用户完成音视频内容的转写、检索、摘要和整理。

Q:阿里云最新发布了什么AI产品?

A:阿里云最新发布了AI绘画创作的纹身图产品统一万象,具备了纹身图和风格迁移、箱子图生成等能力,降低了内容制作的成本。

Q:阿里1,000万在行业落地上有什么潜力和空间?

A:阿里1,000万在发布两周后就有超过20万的企业想要接入,实现自身业务效率的提升,显示了在整个行业落地上具有潜力和空间。

Q:阿里的大模型能给阿里云带来什么业绩的提升?

A:目前阿里AI公有云对于阿里云整体收入的贡献大约是3%,随着通译系列模型产品生态和服务能力的成熟,未来有望带来更大的业绩贡献。

Q:对阿里在国内AI和大模型领域的潜力和竞争力如何看待?

A:我们非常看好阿里在国内AI和大模型领域的中长期潜力和竞争实力。

Q:有什么问题可以进一步交流?

A:如果有任何问题,欢迎投资人提出,我们可以进行进一步的交流。

Q:公司在产业端的应用反馈和商业化进度如何?

A:目前从产业端的反馈来看,阿里巴巴在电商和阿里云所处的细分行业应用都是积极的,并且在中国AI应用的行业规模中,专业服务、政府、制造业和银行等行业的规模相对更大。从商业化进度来看,虽然大模型的商业化还在初级阶段,但已经有一些开源模型可以进入企业并实现商业化,未来可能会出现更多这样的场景。

Q:这些国内公司目前还在内部调试,还没有大规模的商用,对吗?

A:是的,对于这些公司来说,商业化和商业预期相关的信息可能还没有披露,因此可能还在内部调试和尝试阶段,还没有大规模的商用。

Q:目前国内的基础算力是否足够,是否存在不确定性?

A:从训练和推理的角度来看,训练端确实需要高性能的GPU芯片,但目前中低端计算芯片仍然可以满足云端训练和高训练计算的需求。长期来看,国产替代仍然是主要的方向。在推理方面,目前国内发展不用过度担心,因为目前中低端计算芯片如t4和t40等产品没有被禁售的风险。

Q:阿里、百度和科大讯飞的模型有什么差异和优势?

A:从综合实力和能力上看,阿里、百度和科大讯飞都处于国内相对理性且领先的第二梯队,科大讯飞在自然语言处理方面的能力更强。目前三家公司的模型使用上没有特别显著的差异,但未来关注各家在算法模型的研发和路线上是否能取得突破,形成差异化。此外,阿里和百度发布的是更通用的多模态大模型,而科大讯飞在自然语言处理方面的能力比较强,因此在图像生成和多模态方面可能会有差异。最后,三家公司基于自身产业资源的积累,在应用场景上可能会有较大区别,阿里在电商和金融方面的优势更大,而百度在政企和产业方面有一些优势。


作者利益披露:转载,不作为证券推荐或投资建议,旨在提供更多信息,作者不保证其内容准确性。
声明:文章观点来自网友,仅为作者个人研究意见,不代表韭研公社观点及立场,站内所有文章均不构成投资建议,请投资者注意风险,独立审慎决策。
S
阿里巴巴-SWR
工分
2.44
转发
收藏
投诉
复制链接
分享到微信
有用 0
打赏作者
无用
真知无价,用钱说话
0个人打赏
同时转发
暂无数据